«Большие данные»: как из мухи делают слона

менеджеры и Аналитики запутались в мифе о «громадных данных», именуя этим термином совсем различные вещи. Что же он свидетельствует в действительности?

«Громадные эти», о необходимости которых все время говорили аналитики, стали фикцией. Таковой вывод возможно сделать, сопоставив сентябрьские отчеты PwC и Accenture на эту тему. Представители бизнеса не хорошо знают, что такое «громадные эти»: любой именует этим термином что-то собственный. В прошлогодней статье The Вашингтон Пост утверждалось, что данный термин по большому счету не свидетельствует ничего определенного; в случае если принять эту версию, он не имеет смысла.

Чем больше размывается понятие «громадных данных», тем больше теряют согласие участники рынка. Все чаще продавец «ответов Big Data» имеет в виду одно, а клиент рассчитывает на что-то второе. По обычному пресс-релизу «Компания N внедрила ответ Big Data» нереально осознать, о какой совокупности идет обращение, как она трудится и в чем ее польза.

В следствии данный сегмент рынка не создаёт чувство устойчивого и надежного.

Чем больше размывается понятие «громадных данных», тем больше теряют согласие участники рынка. Все чаще продавец «ответов Big Data» имеет в виду одно, а клиент рассчитывает на что-то второе

Рассуждая о «громадных данных», аналитики PwC дают им необычное определение: это«новая волна электронной информации, приобретаемой в громадном количестве из растущего количества источников (т.е. не просто эти, собранные отдельной организацией на протяжении собственной простой деятельности)» — «the recent wave of electronic information produced in greater volume by a growing number of sources (i.e., not just data collected by a particular organisation in the course of normal business)».

ИТ-маркетологи и специалисты сходу увидят, что это определение ведет к путанице, неверным ответам опрощеных на вопросы аналитиков и ошибочным ответам в бизнесе. Конечно же, эти, собираемые из фиксированного количества источников одной организацией на протяжении собственной простой деятельности, также бывают «громадными».

В том же отчете PwC приведен пример: оператор собрал информацию о 25 млн собственных клиентов (разумеется, речь заходит о статистике сеансов связи) и сделал наивный вывод, что сеть нового поколения (4G) удачнее всего строить на протяжении основных транспортных магистралей.

Аналитики Accenture не решились дать в отчете собственный определение, а только подчернули, что «у большинства компаний имеется различные определения громадных данных». Но они привели результаты опроса 1007 экспертов, применяющих эти сведенья на практике. Респонденты с сильным сомнением отнесли к «громадным» эти следующих категорий (либо из следующих источников):

  1. Файлы количеством более 20 терабайт (так вычисляют 65% опрощеных).
  2. Углубленная аналитика либо анализ (60%).
  3. Эти от программ визуализации (50%).
  4. Эти из социальных сетей (48%).
  5. Неструктурированные эти (видео, открытый текст, звукозапись) (43%).
  6. Геолокационные эти (38%).
  7. Социальные медиа / мониторинг / преобразование (37%).
  8. Телематика (34%).
  9. Неструктурированные эти / логи / произвольный текст (25%).

Ответы опрощеных на вопрос: «Что из перечисленного вы вычисляете частью громадных данных (независимо от применения этого в вашей компании)?»

Как сделать из мухи слона?


Похожие заметки:

Понравилась статья? Поделиться с друзьями: