NeuroPro

нейронные сети
и анализ данных

Главная
Новости
Услуги
Нейронные сети
Программы
Статьи
Заметки
Ссылки
Вопросы и ответы
Об авторе / контакты
Заметки

Что выросло из нетфликсовского конкурса - или О развитии интернет-платформ поддержки процессов соревновательного решения задач анализа данных

Три года назад (в июне 2007г) в заметке про соревновательный способ решения задач обработки и анализа данных (на примере идущего тогда полным ходом конкурса с призом в миллион баксов от видеопрокатчика Netflix) я прогнозировал, что вряд ли в ближайшее время появится централизованный интернет-проект, организующий единую, удобную для заказчиков и исполнителей площадку для размещения большого числа подобных соревнований. Действительно, отдельные ростки, возникнув, быстро увядали - например, прорекламированный в феврале 2010г в КДнаггетсовской рассылке проект Kaggle так до сих пор и содержит описания всего трех конкурсов (столько же, сколько и было на момент его рекламы).

Другой же сайт, InnoCentive, содержит довольно много предложений по поиску идей или партнеров, но вот по задачам обработки предоставляемых заказчиком выборок данных там тоже появилось пока всего лишь три конкурса. Но сайт этот привлекателен тем, что заказчик конкурса выплачивает вознаграждение победителю или победителям. И одна из задач дэйтамайнинга и прогнозирования там имеет приз в $100000. Хоть и не нетфликсовский миллион, но всё же очень и очень сильно по сравнению с другими вариантами. Есть там и задача поиска метода диагностики одного вида склероза, стоящая пресловутый миллион, но в ней нет предоставленной заказчиком выборки данных (конкурсанты должны опираться на свои собственные данные, т.е. конкурс этот не для простых смертных, а для особо приближенного персонала отдельных медицинских учреждений, занимающихся пациентами с этим склерозом).

Т.е. ни шатко, ни валко конкурсы и соревнования (с денежными призами или без) по решению задач обработки и анализа данных продолжают появляться. Лидирующей же интернет-площадки для хостинга таких конкурсов до сих пор не возникло. Разработчикам интернет-порталов это оставляет шанс выступить со своим проектом и попытаться вывести его в лидеры. Потенциальным же решателям задач приходится искать информацию о соревнованиях в разных местах интернета (в заметке про нейронные сети в зазеркалье я указал на тот факт, что множество нейросетевой информации проходит мимо различных новостевых агрегаторов, а анонсы конкурсов не будут попадать и в научные издания, вот и остается выискивать их, полагаясь в том числе и на случай). В пролёте только хозяева задач - вместо того, чтобы получать лучшее решение от исполнителей со всего мира, им остается полагаться на случай, слухи, знакомства и тому подобные вещи при поиске и приёме сотрудника в штат или при выборе исполнителя по договору.

В общем, ничего пока особо интересного в этом направлении не выросло и не развилось. Не думаю, что идея такой организации удалённой работы коллектива инициативных исполнителей сама по себе является мертворожденной. Скорее, широкие массы потенциальных заказчиков пока не осознают перспектив и плюсов от подобной формы организации труда либо считают свои данные сильно уж секретными, чтобы их раздавать направо и налево. Ну, у каждого, в конце концов, есть право на собственное мнение - не буду стараться тут никого переубеждать.

Дополнение от апреля 2011.
Перепроверил ситуацию с Kaggle - пациент вроде бы ожил и зашевелился (число тамошних конкурсов перевалило за полтора десятка). Вернее, это заказчики решений задач зашевелились. И это хорошо.