Все поля должны быть заполнены.

Миссия

Миссия

Задача, сплотившая нашу команду – ввести интеллектуальный анализ данных в массовый обиход, сделать его таким же привычным процессом работы с информацией, как использование калькулятора, текстового редактора или поиска в интернете.

Для успешного применения любой из существующих техник глубокой аналитики необходимо:

  1. Понимание природы данных, наличие знаний о предметной области, к которой относятся искомые закономерности.

  2. Наличие наработанной интуиции применения алгоритмов и интерпретации результатов их работы; понимания того как должно отражать известные особенности входных данных в параметрах алгоритма; какие манипуляции с параметрами приведут к требуемым изменениям результатов анализа.

Если первое требование, безусловно, относится к эксперту предметной области, то вторую составляющую сейчас берет на себя профессиональный математик, специалист в области машинного обучения, имеющий опыт применения именно тех инструментов, которые будут использоваться в проекте.

Мы считаем, что сейчас возникли предпосылки для того, чтобы сместить акценты в этой паре на эксперта предметной области, а со временем и полностью исключить из процесса анализа посредничество профессиональных математиков.

 

Основа нашей уверенности

В первую очередь, речь идет о новой парадигме анализа данных, созданной и развиваемой научной школой, возглавляемой доктором технических наук профессором Николаем Григорьевичем Загоруйко. Подход, предложенный Загоруйко Н.Г., основан на предположении что человек,  решающий задачи обнаружения эмпирических закономерностей, применяет некоторый универсальный психофизиологический механизм познания, ключевую роль в котором играют способность оценивать меру сходства между объектами и стремление к максимальной  компактности и простоте описания мира в терминах этой меры сходства.


За подробными разъяснениями мы рекомендуем обратиться к монографии Николая Григорьевича: «Когнитивный анализ данных». Однако, чтобы не утруждать долговременным чтением, приведём здесь ряд фактов, проигнорировать которые было бы большим упущением:

  1. Подход позволяет решать все известные задачи анализа данных унифицированным способом. На всех исследованных задачах результаты получаются не хуже известных специализированных подходов, а в ряд случаев и существенно лучше.

  2. Подход позволяет количественно оценивать решение задачи анализа данных, не используя понятия ошибок 1-го и 2-го рода.


Другим веским основанием нашей работы является наступление эры Big Data.

На наш взгляд, современные объемы данных предъявляемых для анализа в большой мере снимают необходимость использования изощренных алгоритмов, перегруженных явными и неявными предположениями о характере закономерностей скрытых в данных, необходимость в которых в первую очередь была обусловлена малыми объемами обучающих выборок.

В своей работе мы делаем ставку на то, что гораздо эффективнее в единицу времени обработать больший объем поступившей информации более простыми алгоритмами, чем потратить её на построение сложной модели на малом количестве данных. В данном случае простота методов обработки имеет два ключевых преимущества:

  1. Поведение «простого» алгоритма очевиднее для пользователя, а следовательно, процесс анализа становится более управляемым.

  2. Чем больший объем информации подвергся обработке, тем достовернее полученный результат.

Наша уверенность в достижимости поставленной цели основана на том, что решение задач анализа данных – это регулярная (пусть и неосознаваемая) практика любого человека. Обобщение наблюдаемых фактов, создание статистических моделей, использование их в дальнейшем для прогнозирования поведения внешней среды – естественный процесс мышления.


Примером подобного рода «бытовой» закономерности является наблюдение: «понедельник – день тяжелый». Фактически, здесь представлена классификационная модель, позволяющая заранее отнести очередной день к классу «тяжелых», только на основании одной наблюдаемой характеристики – «день недели».


Все что необходимо – это  вооружить человека подходящим инструментом, тем самым сняв ограничения на объемы данных доступных непосредственному анализу. Точно так же, как велосипед позволяет ему передвигаться быстрее и дальше за счет использования природной мускульной силы.