Data Scientist

ООО МПК (Призыванет.Ру)
Москва
👨‍💻 Можно удаленно

Зарплата

от 180 000 ₽ до 220 000 ₽

Описание вакансии

Обязанности:
  • ые функции сотрудника:

  • Исследование и разработка статистических моделей для анализа данных

  • Получение данных (Data-mining), работа с данными в виде Rest-API сервисов и реляционными базами данных (MySQL, PostgreSQL)

  • Обработка изображений OCR

  • Обработка звука ASR

  • Обработка OCR и ASR-моделей , построение пайплайнов обработки, векторизация, матрицы свёртки

  • Тестирование гипотез, корреляционный анализ, факторный анализ, фиче-инжининиг, поиск структуры в данных

  • Проектирование и разработка моделей машинного обучения, тренировка классификаторов

  • Доведение моделей машинного обучения до прода

  • А/В тестирование моделей и выбор наилучшего решения, разработка платформы A / B-тестирования качества создаваемых моделей

  • написание статей, отчетов по исследованиям и документации к моделям

  • Изучение потребности компании и разработка решении, в сотрудничестве с отделами управления продуктами и инженерными отделами

  • Обсуждение результатов и статистических концепций с руководителями

  • Разработка пользовательских моделей данных и алгоритмов

  • Создание процессов и инструментов, помогающих отслеживать и анализировать производительность и точность данных

  • Применение прогнозного моделирования для улучшения и оптимизации клиентского опыта, получения дохода, таргетинга рекламы и т. д.

Требования:

  • Высшее техническое или физико-математическое образование

  • Сильные математические навыки. Прекрасное знание теорвера, линала и матстата (умение объяснить теорему Байеса, определить, что такое статистически значимая выборка, доказать Центральную предельную теорему, объяснить суть быстрого и обратного преобразования Фурье)

  • Знание передовых статистических методов и концепций

  • Сильные аналитические навыки

  • Совершенное владение матрицами и тензорами (SVD, тензорный поезд)

  • Понимание оценок качества классификаторов (ROC-AUC, PR, F1)

  • Умение работать с методами кластеризации данных: иерархическая (дендрограмма), PCA, t-SNE

  • Опыт использования статистических методов и методов интеллектуального анализа данных (таких как градиентный бустинг, обобщенные линейные модели / регрессия, случайные леса, деревья и анализ социальных сетей)

  • 5-7 лет опыта построения статистических моделей и обработки наборов данных

  • Наличие профиля в Kaggle не моложе 2х лет, участие, как минимум, в трёх соревнованиях Kaggle

  • Владение Python, умение строить REST-API с помощью фреймворков Flask, Fast-API и т.д.

  • Использование numpy, pandas - умение векторизировать алгоритмы матричными операциями

  • Владение Tensorflow, Sklearn, PyTorch

  • Опыт в построении моделей классификации (kNN, DTree, FastForward-NN, SGD, GB, RandomForest, SVM)

  • Опыт в тренировке моделей машинного обучения: обработка пропусков, кросс-валидация, разделение выборок

  • Знание типов слоёв для преобразований данных (пуллинг) в Keras

  • Умение строить собственные функции потерь, коллбеки в Tensorflow и Scikit-learn

  • Практическое применение ансаблирование методов машинного обучения: беггинг, бустинг, стекинг, мажоритарное голосование

  • Опыт анализа данных от сторонних поставщиков, таких как AdWords, Coremetrics, Crimson, Facebook Insights, Google Analytics, Hexagon и Site Catalyst.

  • Опыт работы с распределенными данными и вычислительными инструментами, такими как Hadoop, Hive, Gurobi, Map / Reduce, MySQL и Spark

  • Опыт по визуализации и представлению данных с помощью Business Objects, D3, ggplot и Periscope.

Условия:
  • Официальное трудоустройство по ТК РФ;
  • График 5/2 с 10:00 до 19:00;
  • Возможная удаленная работа.
Размещено 21/07/2021

Оставьте свои контакты, чтобы работодатель мог связаться с вами

Телеграм-бот RIT.WORK
С ботом rit.work Вы найдете работу, о которой всегда мечтали.

Всего два шага — выбери стек, зарплату и получай уведомления о мега-вакансиях первым.