Хотя для устройства на должность cпециалиста по данным обычно требуется профильное образование, в действительности большую часть времени им приходится заниматься подготовкой, очисткой и организацией данных. Так ответило 60% участников опроса, проведенного краудсорсинговой компанией CrowdFlower. Для совершенствования алгоритмов или построения обучающих выборок времени почти не остается.
Тратить время специалиста одной из самых дефицитных профессий на подготовку данных — большое расточительство, считают аналитики. Более того, как показал опрос, для специалистов это самая нелюбимая часть работы. Тем не менее, более 80% опрошенных заявляют, что в целом довольны своей работой.
Дефицит cпециалистов по обработке данных усилился. В прошлом году о нем говорили 79% опрошенных, а в этом — уже 83%. Наиболее востребованы специалисты по SQL, Hadoop, Python, Java, R, Hive, MapReduce, NoSQL, Pig и SAS. Но особенно важными более половины участников опроса называют методы машинного обучения. А следовательно, главам компаний, интересовавшимся в последние годы в основном технологиями Больших Данных, пора обратить внимание на эту область.