Перед 8 ноября большинство аналитиков предсказывали поражение Дональда Трампа на выборах. Но из того, что этот прогноз оказался ошибочным, не следует делать вывод о несостоятельности технологий обработки Больших Данных, уверены эксперты Enterprise Strategy Group. По их мнению, ошибка может быть связана с методиками сбора данных, а не анализа.
Причиной мог быть недостаточный размер выборки. Ведь какими бы оптимальными ни были аналитические алгоритмы, они работают по принципу «мусор на входе — мусор на выходе», то есть низкое качество данных приводит к неточностям в результатах анализа.
К тому же, согласно большинству национальных опросов, Клинтон должна была выиграть с небольшим отрывом, в некоторых случаях попадавшим в пределы допустимой погрешности. Правда, ученые Принстонского университета считают, что при прогнозировании имела место серьезная систематическая ошибка. Возможно, она была обусловлена тем, что избиратели, не определившиеся на период проведения опросов, слишком поздно сделали окончательный выбор. А аналитики Ovum предположили, что при подведении итогов опросов, которые устраивались по обычному телефону, неверно оценили число тех избирателей, которые отказались отвечать, но при этом участвовали в опросах по другим каналам.