Под огромным массивом информации могут пониматься самые разные данные – например, различные базы данных, статистики запросов поисковых систем, метеоданные за какой-то период и многое другое. Чтобы работать с такой информацией, используется математическая статистика и аналитические методы – машинное и глубокое обучение, прогнозные модели, вероятностный анализ и нейронные сети и их использование для решения необходимых задач.

Зарплатные ориентиры

Доступно более 1 200 вакансий по данным портала hh.ru

Зарплата без опыта работы от 30 000 рублей

Зарплата при опыте от 1 – 3 лет до 300 000 рублей

Срок обучения от 0 уровня до первого заказа от 11 до 24 месяцев

Высокая сложность обучения

Кому подойдет профессия

Профессия подходит для тех, кто обладает математическим и аналитическим складом ума.

Кстати, несмотря на то, что многие онлайн-школы предлагают обучение полностью «с нуля», все равно преимуществом будет наличие математического или технического образования.

Также Data Scientist должен обладать такими качествами, как внимательность, усидчивость и скрупулезность.

Плюсы и минусы профессии

  • Специалисты очень востребованы на рынке.
  • Высокая зарплата.
  • Возможность устроиться как в отечественную, так и в зарубежную компанию (с опытом и знанием языка).
  • Возможность работать удаленно и/или по гибкому графику.
  • Возможность постоянного профессионального развития и «прокачивания» навыков.
  • Профессия довольно сложная сама по себе.
  • Непростое обучение.
  • Необходимо постоянно следить за технологиями и новинками рынка.
  • Необходимость решать сложные задачи, для которых не подходят типовые способы.
  • Непредсказуемые результаты (не всегда можно сказать до начала работы, будет ли модель эффективной).
Работой с большими данными занимаются 8,1% из опрошенных IT-специалистов. Рейтинг составлен на основе опроса более 47 тысяч человек. Источник
Знание языков программирования.

В сфере Data Science наиболее востребованными являются Python, R, SAS или Java

Работа с SQL.

Это язык управления базами данных, который нужен специалисту для извлечения данных и их последующего моделирования

Знание математики и статистики.

Несмотря на множество библиотек с готовыми решениями, они не всегда подходят для решения нетипичных задач, поэтому специалисту нужно знание линейной алгебры, матанализа, теории вероятности и статистики

Технологии машинного обучения.

Это методики анализа данных, которые позволяют аналитической системе обучаться в ходе решения множества похожих задач

Для старта в профессии

  1. Уверенное использование инструментов для работы с Big Data. Наиболее популярными являются Hadoop, MapReduce, Apache Hive, Apache Kafka, Apache Spark.
  2. Знание алгоритмов глубокого обучения. Это совокупность методов машинного обучения, основанная на искусственных нейронных сетях, с обучением представлениям.
  3. Уверенное использование инструментов для визуализации данных, построения графиков и диаграмм. Например, Tableau, Metabase, Power BI.

Продвинутый уровень

  1. Понимание основ дата-инжиниринга (Data Engineering). Нужно для того, чтобы взаимодействовать с информационными инженерами, которые занимаются организацией сбора, хранения и доступа к данным.
  2. Внедрение моделей в production. Все инструменты и знания должны в итоге использоваться в интересах бизнеса.
  3. Знание английского языка. Большое количество специализированной литературы доступно только на английском языке – и без нее невозможно повысить квалификацию.
Согласно рейтингу, составленному по результатам опроса, более 57 тысяч респондентов, SQL, Python, Java являются одними из самых востребованных технологий среди разработчиков. Источник

Инструменты

Python. Популярный высокоуровневый язык программирования
Pandas. Популярная и быстроразвивающаяся библиотека для обработки и анализа данных в Python
PostgreSQL. База данных с открытым исходным кодом, на основе которой функционируют многие приложения
Apache Spark. Фреймворк для реализации распределенной обработки неструктурированных данных
OpenCV. Библиотека алгоритмов компьютерного зрения
R. Язык программирования для статистической обработки данных
Hadoop. Программный каркас, который помогает обрабатывать и хранить массивы информации
Matplotlib. Библиотека на языке Python для построения научных графиков
Чарльз Делекторских
Fullstack-разработчик

Как правило, специалист Data Scientist работает в большой компании. Крупные работодатели часто принимают к себе новичков, но если у человека совсем нет опыта, то нужно понимать, что в первые месяцы это будет работа на невысокой позиции (возможно, даже в качестве стажера или помощника) с соответствующей зарплатой.

По мере наработке опыта и овладения новыми технологиями растет востребованность Data Scientist, как специалиста. Через несколько лет после начала карьеры, если человек успешно трудится, занимается саморазвитием, повышением квалификации и знает английский язык хотя бы на среднем уровне, он может рассчитывать на трудоустройство даже в зарубежную компанию – с соответствующим окладом и возможностями.

— Чарльз Делекторских Fullstack-разработчик

Как научиться профессии Data Scientist

Лучшие онлайн-курсы

Топ-5 курсов для Data Scientist
#
Название курса
Стоимость
Минимальный взнос при рассрочке
Срок обучения
Помощь в трудоустройстве
3
156 000 ₽
4 333 ₽ (рассрочка на 36 мес.)
17 мес.
4
228 000 ₽ при оплате сразу
16 000 ₽ (256 000 в сумме при помесячной оплате)
16 мес.
5
126 000 ₽
3 500 ₽ (рассрочка на 36 мес.)
11 мес.
Топ-5 курсов для Data Scientist
Профессия Data Scientist
1
Курс поможет стать специалистом по анализу данных, нейросетям и алгоритмам машинного обучения и получить в дальнейшем хорошую работу – в российской или зарубежной технологической компании.
Стоимость:
165 888 ₽
Учиться в Skillbox

Кому подойдет:

  • Тем, кто не имеет опыта в IT. Курс поможет получить практические навыки программирования, аналитики, математики и статистики и заложит прочную основу для карьеры в Data Science.
  • Программистам. Курс расширит знания программирования на Python и R, научит мыслить аналитически и применять алгоритмы машинного обучения для решения бизнес-задач.
  • Начинающим аналитикам. Курс обучит ставить гипотезы и делать выводы на основе данных, писать коды на Python и R, понимать математику на основе статистики и превращать сырую информацию в полезные сведения для работодателя.

Чему научат:

  1. Визуализация данных.
  2. Программирование на Python и R.
  3. Работа с базами данных и библиотеками.
  4. Создание рекомендательных систем.
  5. Использование нейронных сетей для решения реальных задач.
Профессия Data Scientist
2
Курс позволит полноценно, «с нуля» освоить востребованную профессию Data Scientist, получить практические навыки решения реальных бизнес-задач уже во время обучения, а затем уверенно претендовать на среднюю зарплату по отрасли.
Стоимость:
276 000 ₽
Учиться в SkillFactory

Кому подойдет:

  • Новичкам. Курс позволит освоить новую профессию «с нуля», достаточно будет школьных знаний.
  • Тем, кто хочет получить фундаментальное образование. Курс дает полый спектр знаний – теоретическую базу, новые парадигмы мышления, практические навыки.

Чему научат:

  1. Визуализация данных с помощью Pandas, Matplotlib.
  2. Использование Python для проектирования алгоритмов.
  3. Создание моделей с помощью классического машинного и глубокого обучения для решения задач Data Science.
  4. Построение математических и ML-моделей.
  5. Применение алгоритмов для рекомендательных систем.
  6. Вывод и поддержка моделей в Production.
  7. Использование методов математического анализа, статистики и теории вероятности для обработки данных.
  8. Одна из дополнительных специализаций (продвинутый SQL, продвинутый Python, Reinforcement Learning или Data Engineering).
Data Scientist: с нуля до middle
3
Курс «с нуля» научит работе с аналитикой, нейронными сетями, поможет развить «мягкие навыки» (коммуникацию в команде, эмоциональный интеллект и т. д.), получить более 10 кейсов в портфолио и позволит начать работать по специальности уже во время обучения.
Стоимость:
156 000 ₽
Учиться в Netology

Кому подойдет:

  • Новичкам в Data Science. Курс позволит «с нуля» освоить востребованную профессию и даст все необходимые знания и навыки для старта карьеры.
  • Разработчикам. С помощью курса можно получить отличную базу для того, чтобы перейти из программирования в Data Science.
  • Аналитикам. Курс научит извлекать по максимуму из больших массивов данных для проверки гипотез и построения прогнозов и познакомит с новыми инструментами, которые позволят расширить профессиональные навыки.

Чему научат:

  1. Работа с SQL.
  2. Использование Python и библиотек.
  3. Использование математики в алгоритмах.
  4. Проверка данных и определение проблем.
  5. Построение моделей машинного обучения.
  6. Обучение многослойных нейронных сетей.
  7. Работа в команде.
Специалист по Data Science плюс
4
Расширенный курс для тех, кто хочет построить карьеру в Data Science, теоретическая база со множеством практических задач и возможность пополнить портфолио новыми проектами.
Стоимость:
228 000 ₽ при оплате сразу
Учиться в Яндекс.Практикум

Кому подойдет:

  • Тем, кто только начинает разбираться в Data Science. Курс даст фундаментальные знания и поможет ничего не упустить.
  • Тем, у кого уже есть базовые знания в Data Science. Курс поможет углубить и дополнить их.

Чему научат:

  1. Основы Python и библиотеки Pandas.
  2. Основы машинного обучения.
  3. Вспомогательные инструменты Data Science (приложения для командной строки, Git, Docker и т. д.).
  4. Математика машинного обучения.
  5. Системы хранения данных.
  6. Практика машинного обучения.
  7. Основы Deep Learning.
Data Scientist
5
Курс позволит освоить новую профессию, которая позволит получать стабильно высокий доход и не устареет и через десять лет.
Стоимость:
126 000 ₽
Учиться в Netology

Кому подойдет:

  • Новичкам в Data Science. Курс позволит «с нуля» овладеть всеми знаниями и навыками, необходимыми для успешного начала работы по специальности.
  • Разработчикам. Курс позволит перейти в Data Science из программирования, даст множество практических навыков и позволит пополнить портфолио интересными кейсами.
  • Аналитикам. Курс поможет систематизировать знания и глубже погрузиться в Data Science.

Чему научат:

  1. Работа со SQL.
  2. Построение модели машинного обучения.
  3. Лидирование DS-проекта.
  4. Использование Python.
  5. Проверка данных и определение проблем.

Ютуб-каналы

Канал о том, как войти и развиваться в data science, как начать обучение
Канал о Data science и программировании
Открытый курс OpenDataScience и Mail.ru Group по машинному обучению

Телеграм-каналы

Полезные материалы по всему, что может быть интересно дата сайентисту
Статьи на тему data science, machine learning, big data, python, математики
Добро пожаловать в чат по Data Science, Machine Learning и AI
First Telegram Data Science channel

Книги

Частые вопросы о профессии

Правда ли, что для того, чтобы стать Data Scientist, нужно высшее математическое или техническое образование?

Нет, но наличие такого образования послужит дополнительным плюсом.

Я абсолютный гуманитарий. Я могу стать Data Scientist?

Да, конечно. Возможно, человеку с гуманитарным складом ума потребуется чуть больше времени и усилий.

Можно ли полноценно освоить профессию самостоятельно?

Нет, только получить какие-то первичные представления о ней.