Статьи

Войти в ИТ: профессия Data Scientist

Сегодня мы поговорим про такое актуальное направление в сфере IT,как Data Science. Почему это направление так быстро развивается, чем занимаются Data Scientist в компаниях, в чем особенность работы на проектах финтеха? На эти и другие вопросы ответила нам руководитель отдела анализа данных Наталья Смирнова, компания Cotvec.

Войти в ИТ: профессия Data Scientist

1. По твоему мнению, почему Data Science так стремительно развивается сейчас?

Основная причина – это цифровизация общества и, как следствие, неконтролируемый рост генерируемых человечеством данных. Ведь основа Data Science – это именно данные. Вторая причина – это высокая востребованность подобных технологий, они делают нашу жизнь более удобной, а к «хорошему быстро привыкаешь» и сейчас технологии с использованием искусственного интеллекта воспринимаются нами, как что-то само собой разумеющееся, а спрос, естественно, всегда рождает предложение.

2. Кто такой Data Scientist и чем он обычно занимается в компании?

Если объяснять через более понятные специальности, то Data Scientist – это соединение навыков программиста, математика и бизнес-аналитика.

Вне зависимости от сферы деятельности компании, Data Scientist всегда работает с большими объемами данных. Он занимается сбором, обработкой и анализом данных, делает выводы на основе выявленных зависимостей, разрабатывает модели машинного обучения для предсказания событий и обнаружения неочевидных закономерностей и визуализирует результаты своей работы.

Для того, чтобы все это сделать, Data Scientist использует математические алгоритмы, языки программирования и BI-инструменты для анализа и визуализации данных. Работают специалисты Data Science с данными любого формата: текст, таблица, фото, видео, звук.

В качестве примеров работы таких специалистов можно назвать прогнозы погоды, рекомендательные системы в онлайн-магазинах, системы распознавания лиц и отпечатков пальцев, чат-боты и многое другое.

3. Какие технологии необходимо освоить, чтобы стать Data Scientist. Откуда часто приходят в это направление? С чего начать?

Если говорить именно о технологиях, то я рекомендую начать с изучения языков программирования. Самый популярный в Data Science — Python, поэтому в первую очередь имеет смысл изучить его, хотя и другие языки тоже не стоит игнорировать, например, R.

Среди обязательных для изучения — SQL, который нужен для работы с базами данных, поскольку одним из важнейших процессов моделирования является, прежде всего, извлечение данных из различных источников. В большинстве случаев вам нужно будет уметь писать и запускать SQL-запросы к базам данных. С этого уже можно начинать.

Но в процессе изучения технических моментов вы так или иначе будете сталкиваться с теоретической частью, которая стоит за кодом, лучше всего изучать ее без отрыва от практики — так будет намного эффективнее и быстрее.

Если говорить о том, откуда чаще всего приходят в это направление, то я могу выделить три сферы – это анализ данных, статистика или математика и, естественно, программирование – и это вполне объяснимо, поскольку Data science включает в себя все эти три сферы.

Для того, чтобы стартовать, лучше всего начать с практической реализации какого-либо кейса, которых в изобилии на Kaggle. Если вы решите опубликованные там задания лучше остальных – то это будет очень хорошая запись в вашем резюме.

4. Есть ли специфика работы Data Scientist в финтехе? В чем особенность?

Для того, чтобы качественно проанализировать данные, Data scientist должен хорошо разбираться в специфике анализируемого объекта. Поэтому для работы в финтехе нужно знать, как работают те или иные финансовые инструменты, какие есть особенности государственного регулирования этой сферы, важно также разбираться в бухгалтерском и управленческом учете.

5. А какие сложности и преимущества работы на финтех проектах?

Большое преимущество работы в финтех секторе – высокое качество данных. Это связано с тем, что в компаниях этого сектора процессы сбора, проверки и хранения данных очень хорошо отлажены. Качественные данные «на входе» здорово экономят время специалистов Data Science на анализ данных и разработку моделей машинного обучения.

6. Данные захватят вселенную или мы справимся?

Данные сами по себе никого не захватят)) А вот технологии, разработанные на основе этих данных, вполне возможно и будут управлять человечеством. Даже сейчас мы читаем новости, которые нам «подбрасывают» соцсети, смотрим ролики, рекомендованные youtube.

Никто из нас не может с уверенностью сказать, что мысли в его голове – это его собственные мысли, а не навязанные извне. Но мы справимся или, правильнее сказать, адаптируемся к новой реальности.

Вакансии дня