NeuroPro | нейронные сети |
|
Главная Новости Услуги • примеры задач • польза • с небес на землю • пожелания • хранение данных • реализация Нейронные сети Программы Статьи Заметки Ссылки Вопросы и ответы Об авторе / контакты |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
9. Кластеризация (автоматическая классификация) данных - выделение категорий, разбиение набора ситуаций на несколько групп.Научное название: кластерный анализ, классификация без учителя, автоматическая классификация. Реальные примеры: исследование, распадается ли набор анализируемых ситуаций на несколько групп так, что ситуации внутри каждой группы более похожи друг на друга, чем на ситуации из других групп. Например, выявление наличия нескольких вариантов течения болезни, выявление наличия нескольких групп потребителей, автоматическая рубрикация текстов или новостей по темам. Описание. Делается попытка выделить несколько групп ситуаций, для каждой группы определить типичных представителей. Изучается степень различия между выявленными группами. Часто кластерный анализ позволяет повысить точность решения задач прогнозирования или классификации потому, что внутри каждого кластера задача прогнозирования или классификации может быть решена отдельно - за счет сокращения областей компетенции прогнозных моделей ликвидируется надобность в "утряске" зачастую противоречивых для разных кластеров зависимостей между показателями и прогнозом или номером класса; за счет отхода от прогнозирования через "среднюю температуру по больнице" (при использовании единой модели) точность может быть повышена через учет локальных и уникальных для каждого кластера зависимостей и факторов. Из методов кластерного анализа до сих пор широко и независимо от объема анализируемых данных применяется классический метод динамических ядер (k-means). Экзотические методы бывают нужны относительно редко. |