CIAN

Senior Data Scientist

в CIAN

200 000 - 300 000 ₽/мес на руки

Москва Санкт-Петербург Remote
icon Москва, Россия
Специализация
Data Science / Machine Learning
Уровень
Senior
Команда
6 - 10 человек

Циан – крупнейший в России сервис для поиска недвижимости. 18 лет мы помогаем людям найти, сдать, продать жилье по всей России. Циан не просто сайт, это высокотехнологичная компания, которая входит в топ-10 лучших сайтов по недвижимости в мире. Сейчас в компании работает 500+ сотрудников в двух офисах России — Москве и Санкт-Петербурге, а ежемесячная аудитория сервиса — свыше 14 миллионов человек.

Временная зона команды

(GMT+3), Москва.

Технологии/инструменты

  • Big Data: Hadoop, Hive, Spark, Kafka.
  • Deep Learning: PyTorch.
  • Classic ML: Numpy, Pandas, Sklearn, XGBoost, LightGBM, CatBoost.

Так же в зависимости от задач есть: PostgreSQL, Phoenix, ElasticSearch, RabbitMQ.

О команде

  • Основные задачи, которые решает команда: персональные рекомендации; ранжирование поисковой выдачи; антифрод (модерация); поиск дубликатов объявлений, антибот, оптимизация ценообразования и многие другие. Так же есть CV, (например, нахождение одинаковых фоток, классификация), NLP и аудио (коллтрекинг).
  • Отлично подойдет тем — кто любит mixed-data, ибо почти в каждой задаче можно прикрутить и тексты и фоточки и классический ML.
  • Текущие процессы позволят новому сотруднику работать в офисе (Москва/Питер) или же полностью удалённо.

Людям Циан важно

  • Делать не просто продукт, а лучший продукт, который меняет клиентский опыт. Команда гордится тем, что трансформирует рынок недвижимости, закрывая боли людей с поиском, продажей, ипотекой и арендой жилья.
  • Решать сложные задачи и искать новые решения. Поэтому рабочий день иногда похож на квест, благодаря которому каждый может расти намного быстрее.
  • Влиять на продукт. Слушают коллег и используют их экспертизу, идеи для выбора наилучшего решения в развитии продукта.
  • Чувствовать себя комфортно в команде, говоря то, что думают. Для этого развивают культуру обратной связи и взаимного уважения.

Задачи, которые могут стать твоими:

  • Создание NLP моделей для анализа расшифрованных записей колл-трекинга.
  • Разработка моделей классического ML для оценки готовности пользователя совершить целевое действие и для оценки “привлекательности” объявлений на сайте.
  • Построение оптимальной модели ценообразования в зависимости от сложности поиска покупателя для объекта жилья и внешних факторов рынка.

Видят на этой позиции человека, который:

  • Имеет прикладной опыт применения МЛ в продакшн. Быстро понимает, какой результат “может быть“, а кого “не может быть”.
  • Имеет представление о дизайне архитектуры ML решения: как разбить пайплайн на компоненты (бэкенд, квери-серч, инференс модели и тд).
  • Способен построить процесс разметки данных (Толока, свое АПИ для ручной разметки).
  • Способен разобраться почему метрики на проде отличаются от метрик на этапе валидации модели. Понимает где разница существенная, а где нет. Способен устранить проблему (например, определить какие фичи были с ликом и как его устранить).
  • Умеет реализовать качественную кросс-валидацию и подобрать гиперпараметры с которыми модель не переобучена и не недообучена.
  • Имеет опыт в классическом ML (различные имплементации бустинга, чем отличаются).
  • Знаком с популярными архитектурами сеток, может на PyTorch (или на Keras) реализовать train loop.
  • Знаком с методами понижения размерности: понимает суть PCA, знаком с автоэнкодерами, t-sne, svd.
  • Знает и применяет алгоритмы отбора фичей (boruta, генетические алгоритмы, etc).
  • Знаком с основами NLP: (как минимум, fit-predict последних слоев условного bert-а, суть LSTM, проблемы с градиентом: затухание, взрыв).
  • Имеет опыт работы с GPU (CUDA, nvidia-drivers; утилиты для мониторинга nvidia-smi/nvtop).
  • Уверенно кодит на Python (декораторы, пакетные менеджеры, генераторы, итераторы, контекстные менеджеры).

Будет плюсом:

  • Стат. тесты. Умение объяснить что такое p-value и умение этими инструментами пользоваться. Можете посчитать, что одна модель стат. значимо отличается от другой. (t-test, хи кварат).
  • Знакомство с основами CV: OpenCV (SIFT/SURF фичи, свертки, преобразование Фурье). Можете реализовать edge detection, Hough transform.

Что предлагают

  • Оформление по ТК, белую зарплату.
  • Современный БЦ с фитнес-центром.
  • Две кухни оборудованными всем необходимым: микроволновые печи, кофемашины, чайники и т.д. Также на кухне всегда доступны снеки, фрукты, кофе и чай.
  • 5 day off в год, помимо основного отпуска.
  • Компенсация спорта.
  • Профессиональный рост (ЛПР, корпоративная библиотека).
  • ДМС с первого рабочего дня (со стоматологией, госпитализацией, страховкой выезжающего за пределы нашей страны).
  • Корпоративный врач в офисе.
  • Бесплатная авто и вело парковка.
  • Офисный транспорт (самокаты).
  • Комнаты, где можно поработать в полной тишине.
Ирина Ситдикова Remote Recruiter
CIAN

О компании CIAN

Сфера
Продуктовая компания
Инвестиции
Приватное финансирование
Размер
501 - 1000

Циан — крупнейший в России сервис для поиска недвижимости. Компания входит в топ-10 лучших сайтов по недвижимости в мире, ежемесячная аудитория сервиса — свыше 14 млн. человек.