NeuroPro

нейронные сети
и анализ данных

Начало
Новости
Услуги
• решаемые задачи
• примеры задач
• польза
• с небес на землю
• пожелания
• хранение данных
• реализация
Нейронные сети
Программы
Статьи
Заметки
Ссылки
Вопросы и ответы
Об авторе / контакты

С небес на землю

Перечислим возможные причины невыполнения ожиданий от результатов анализа данных и реально достижимые результаты.

Возможные причины неудач

  • Слишком сложная внутренняя природа анализируемых ситуаций, чтобы можно было достичь высокой точности решения только на основе легко доступных описательных характеристик. Слишком сильные искажения, возникающие при измерениях наблюдаемых характеристик.
  • Быстрое изменение причинно-следственных связей, что делает неэффективным использование построенной на старых данных модели для предсказания последствий будущих ситуаций.
  • Малый объем доступных для анализа данных, возможно, из-за быстрой потери данными актуальности (см. пред. пункт).
  • Нельзя до начала разработки аналитическо-прогнозной системы предсказать достигаемый в итоге уровень точности решения или гарантировать достижение требуемого заказчиком уровня точности. Только после экспериментов по определению достижимого уровня точности заказчик сможет оценить, станет ли экономически обоснованным внедрение аналитической системы.

Что можно гарантировать

  • Если раньше те же самые данные анализировались простыми математическими методами (например, базовыми методами классической статистики), то можно ожидать повышения точности моделирования за счет применения более гибких и мощных методов.
  • При недостаточном для хорошей точности прогноза объеме данных возможно оценивание необходимого для повышения точности объема дополнительных данных (здесь речь идет о числе примеров-описаний ситуаций, а не числе показателей, которыми характеризуется каждая ситуация).
  • Возможно нахождение малоинформативных (шумовых или избыточных) показателей, взаимозамен между группами показателей. Это поможет принять осмысленное решение о том, какие дополнительно показатели для описания ситуаций может быть нужно ввести. Если имевшиеся предположения об информативности отдельных показателей оказались в действительности неверными, то можно попытаться переформулировать задачу и собирать для ее решения отличающуюся информацию (отдельные показатели останутся прежними, на место неинформативных показателей нужно будет взять иные).
  • Если ранее удалось получить нужный уровнень точности при использовании методов непараметрической статистики, но реальное внедрение было затруднено по причине слишком большого времени срабатывания непараметрической модели, то возможно получение быстро работающей модели аналогичной точности, не требующей хранения обучающей выборки и пригодной для использования в реальном времени или для электронной аппаратной реализации.