Яндекс.Метрика Рейтинг@Mail.ru
 
Компьютерная система "КАРКАС"
Компьютерная система "КАРКАС"
238-927-218     veadrub1







Регистрация »         Забыл пароль »

07 Февраль 2019
МОДЕЛЬ ІЄРАРХІЧНОЇ ФУНКЦІОНАЛЬНОЇ СИСТЕМИ ДЛЯ КЛАСТЕРНОГО АНАЛІЗУ Збірник наукових праць ХНУПС 2(56). Харків,  2018, с. 82 - 88. Розглядається модель ієрархічної функціональної системи предметної...

29 Апрель 2016
Сложность динамических систем Практика показывает, что главной в теории сложных систем становится проблема принятия решений при наличии многих целей. Динамической следует...

28 Апрель 2016
Формирование компетентностей и их оценка с помощью интеллектуальных тестов Рассматривается модель функциональной системы динамической предметной области, на основе понятия расслоения баз знаний для создания...

Интеллектуальный кластерный анализ данных

Задачи классификации являются одними из самых важных как в научно-технических исследованиях, проводимых в биологии, медицине, геологии, так и в социально-экономических. По своей постановке такие задачи разнообразны и многочисленны. Одна из них – классификация без обучения – заключается в разбиении совокупности объектов, которые описываются набором признаков, на однородные группы, называемые кластерами. Для решения такой задачи используют методы кластерного анализа, которые позволяют выделить в р-мерном пространстве признаков многомерных объектов самой разной природы кластеры, обладающие специальными свойствами (компактностью, связностью и другими) . При классификации многомерных наблюдений результаты кластерного анализа позволяют исследователю более обоснованно относить неизвестный объект к тому или иному известному классу.

Кластерный анализ (кластеризация, таксономия, самообучение, обучение без учителя) предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации (cluster  — гроздь, пучок, скопление, группа элементов, характеризуемых каким-либо общим свойством). Критерий качества кластеризации (функционал качества разбиения) в той или иной мере отражает следующие неформальные требования:
внутри групп объекты должны быть тесно связаны между собой;
           объекты разных групп должны быть далеки друг от друга;
           при прочих равных условиях распределения объектов по группам должны быть равномерными.
В алгоритмах кластеризации наиболее важным и наименее формализованным является определение понятия однородности, или меры близости объектов, кластеров и качества разбиения объектов на группы (объективности получаемых группировок), отчего преимущественно зависит окончательный результат классификации. В каждой конкретной задаче эта проблема решается по-своему и зависит в основном от целей исследования, структуры, вида исходных данных и в значительной степени опирается на интуицию исследователя. Все это указывает на то, что реализация таких алгоритмов в виде прикладных программ  в пакетном режиме малоэффективна. Поэтому для оптимального эвристического решения задач кластеризации исследователь должен активно использовать знания экспертов по кластерному анализу.
Итак, кластеризация объектов, каждый из которых описывается набором признаков, предполагает нахождение однородных групп объектов (кластеров), выделение их скрытой структуры без точного знания типичных представителей. Имеется много методов и алгоритмов кластеризации, которые ориентированы на решение различных задач классификации. Проблема кластеризации состоит в том, что для каждого конкретного типа данных, структуры расположения объектов в пространстве признаков надо или правильно подобрать известный алгоритм, или его адаптировать или разработать новый. Для решения этой проблемы широко применяют знания экспертов.
Система "КАРКАС" имеет модуль интеллектуальной кластеризации многомерных данных - для  выбора алгоритма кластеризации используется база знаний.
Модель базы знаний  по кластерному анализу охватывает применение ряда алгоритмов автоматической классификации, таких, как итеративный алгоритм   К-внутригрупповых средних, алгоритм "ISODATA", метод динамических сгущений, иерархическая процедура и другие.
Процесс кластеризации можно разбить на ряд этапов, которые характеризуются заданием меры сходства для объектов в пространстве признаков, выбором стратегии образования кластеров (например, иерархическая, использование различных мер сходства между кластерами), выбором оценки качества разбиения объектов на кластеры и некими эвристическими соображениями.
При формализации знаний о процессе кластеризации можно выделить атрибуты, например, признаки, расстояние, межкластерное расстояние, число кластеров. Каждый из них принимает конкретное значение в различных алгоритмах кластеризации. Например, атрибут “признаки“ в зависимости от значений (количественные, порядковые, номинальные, дихотомические) определяет соответствующую метрику в пространстве признаков или меру сходства между объектами. К тому же некоторые атрибуты, например, число кластеров, могут динамически изменяться в ходе работы алгоритма.
 
Презентация Модуль интеллектуального кластерного анализа в системе "КАРКАС" 


 
2012 г. it-karkas.com.ua
Владимир Бурдаев

 
Контакты
Статьи
Новости
Инфо для пользователей
Ссылки
Карта сайта

 
Рейтинг@Mail.ru

Copyright 2018 - it-karkas.com.ua
Разработка сайта - alphastudio.com.ua