Вестник цифровой трансформации

Data scientist выполняют работу «цифровых дворников»

12:55 28.03.2016  |  4405 просмотров



Самая нелюбимая часть работы специалистов по данным - подготовка, очистка и организация данных, именно на нее приходится тратить большую часть времени. На более творческую работу времени у обладателей одной из самых дефицитных профессий почти не остается.

Хотя для устройства на должность cпециалиста по данным обычно требуется профильное образование, в действительности большую часть времени им приходится заниматься подготовкой, очисткой и организацией данных. Так ответило 60% участников опроса, проведенного краудсорсинговой компанией CrowdFlower. Для совершенствования алгоритмов или построения обучающих выборок времени почти не остается.

Тратить время специалиста одной из самых дефицитных профессий на подготовку данных — большое расточительство, считают аналитики. Более того, как показал опрос, для специалистов это самая нелюбимая часть работы. Тем не менее, более 80% опрошенных заявляют, что в целом довольны своей работой.

Дефицит cпециалистов по обработке данных усилился. В прошлом году о нем говорили 79% опрошенных, а в этом — уже 83%. Наиболее востребованы специалисты по SQL, Hadoop, Python, Java, R, Hive, MapReduce, NoSQL, Pig и SAS. Но особенно важными более половины участников опроса называют методы машинного обучения. А следовательно, главам компаний, интересовавшимся в последние годы в основном технологиями Больших Данных, пора обратить внимание на эту область.

Теги: Автоматизация предприятий Большие данные Data Science Машинное обучение

На ту же тему: