NeuroPro

нейронные сети
и анализ данных

Главная
Новости
Услуги
• решаемые задачи
• примеры задач
• польза
• с небес на землю
• пожелания
• хранение данных
• реализация
Нейронные сети
Программы
Статьи
Заметки
Ссылки
Вопросы и ответы
Об авторе / контакты

Хранение данных

Для задач классификации с учителем, регрессии, прогнозирования временных рядов (авторегрессии) и других здесь описано наиболее универсальное представление данных в виде плоских таблиц (единственного файла формата DBase, одной таблицы внутри базы данных Microsoft Access, одного листа в электронной таблице Excel,..). Это наиболее простой способ ввода и хранения данных для неподготовленного пользователя. Хранение же данных в виде набора таблиц в реляционной базе данных требует предварительной работы программиста для разработки нормализованной схемы базы данных и программирования некоторого интерфейса для ввода данных (поскольку относящиеся к одной ситуации данные могут требовать помещения в несколько таблиц) и выходит за рамки излагаемого здесь описания.

Представление набора отдельных не связанных между собой ситуаций

Пример таблицы для задач классификации и прогноза Пусть ситуация характеризуется набором значений показателей A, B, C,.., причем число показателей одинаково для описания каждой ситуации, меняются только значения этих показателей. Тогда можно внести характеризующие отдельную ситуацию значения в отдельную строку таблицы, как показано на рисунке. Требующий прогноза показатель может храниться и в первой колонке, и в последней, и в любой из промежуточных − все определяется удобствами пользователя при вводе данных. Если каким-то из показателей является дата или время, то не обязательно упорядочивать ситуации по нарастанию значения даты или времени в соответствующей этому показателю колонке.

Представление временных рядов

Пример таблицы для задачи прогноза временных рядов

Пусть имеется одна или несколько величин (A, B, C и так далее), измерения которых начинаются в некоторый единый стартовый момент времени и повторяются через одинаковый интервал. Тогда номер строки таблицы может задавать порядковый номер измерения (первое, второе, третье и так далее), а в строке таблицы с соответствующим номером находятся значения измеренных в этот момент величин, как показано на рисунке. Такая привязка номера измерения к номеру строки таблицы позволяет специально не вводить колонку с реальными значениями даты или времени, если только значения даты/времени не нужны пользователю для иных целей.