РБК Pro —  
информационный сервис для предпринимателей и управленцев. Первый месяц — бесплатно
РБК Pro
— сервис для вашего бизнеса. Зарегистрируйтесь и получите доступ ко всем материалам. Первые 30 дней бесплатно.

Не верьте в «волшебные» алгоритмы: как работать с большими данными

Маркетинг Инструкции Ipsos
Почему большие данные не решают всех проблем бизнеса, на что data scientists тратят больше всего времени, с чего начинать анализ и как сформировать команду исследователей — объясняют эксперты Ipsos

Вопрос качества

Большие данные помогают лучше понять потребителей, спрогнозировать их будущие покупки и найти инсайты. Но для этого они должны быть правильно собраны и обработаны. Ключевой проблемой остается качество. Само по себе использование больших данных не гарантирует, что их исследование принесет ощутимую пользу компании. Здесь работает принцип «что посеешь, то и пожнешь». Некачественные данные не позволяют широко применять алгоритмы машинного обучения.

Чтобы создать рабочую модель для прогноза, вам нужны данные

  • с широким охватом,
  • правильно промаркированные,
  • не дублированные.

К сожалению, сегодня большая часть данных, которые использует в своей работе бизнес, не соответствует этим стандартам. Самые распространенные проблемы ― недостаточный или неравномерный охват, пробелы и ошибки в записи данных.