Основные хард-скиллы, которые нужны профессионалу:
-
Применение математической статистики и теории вероятностей. Навык необходим для получения корректных данных и работы с ними, поиска закономерностей, проверки гипотез.
-
Использование языка запросов к базам данных SQL и языка программирования Python. Для сбора данных из разных источников, их обработки и визуализации результатов.
-
Анализ данных. Скилл позволяет определять логику событий, случайные величины и важные показатели.
-
Выполнение математических вычислений с помощью библиотек Python. Умение помогает быстро проводить операции с большими объёмами данных. Популярные инструменты для анализа массивов информации — Pandas и NumPy, для машинного обучения — scikit-learn, также в работе применяются нейросетевые библиотеки Keras и PyTorch.
-
Построение предсказательных моделей и обучение нейросетей. Навык нужен для автоматизации рекомендательных систем.
-
Визуализация данных. Для наглядного отображения показателей, которые важны заказчику.
- Внедрение моделей машинного обучения в бизнес-процессы.
Ключевым мягким навыком специалиста считается умение в понятной форме презентовать работу руководству и другим заинтересованным лицам. Сотрудник должен уметь разговаривать с ними на понятном языке — в первую очередь, чтобы понимать задачу.
На примере вакансии в компании «Строительный двор» посмотрим, какие скиллы ожидает увидеть в Data Scientist реальный работодатель: