CIAN

Senior Data Scientist

в CIAN

от 400 000 ₽/мес на руки

📍 Москва (м. Преображенская площадь)Санкт-Петербург (м. Адмиралтейская)Можно удалённо из РФ
Специализация
Data Science / Machine Learning
Уровень
Senior
Команда
21 - 50 человек

Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.

Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков.

Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.

Ежемесячная аудитория превышает 18,7 млн. уникальных пользователей.

Офисы компании расположены в Москве, Петербурге и Новосибирске, есть возможность выбрать любой режим посещения или работать вовсе удаленно фулл-тайм.

И сейчас нам нужен +1 Senior ML-инженер в “Новостройки”.

Технологии/инструменты

PythonSQLPyTorchHDFS / Kafka / PySpark
  • Пишем преимущественно на Python (NumPy, SciPy, Pandas, Sklearn, Keras, PyTorch).
  • Активно пользуем экосистему Hadoop (PySpark, Phoenix/HBase, Hive, Kafka), у нас свой кластер.
  • Вычислительные ресурсы для разработки: в том числе машины.
  • Luigi + самописные дополнения к Luigi для шедулинга тасок.
  • Для технических метрик — Grafana, для бизнес-метрик — Superset.

О команде

Нас уже 20+ человек в команде МЛ. Это и сайнтисты и дата инженеры и своя MLOps платформа. Команда разделена на продуктовые стримы. Т.е. мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес-направления. С процессами интеграции моделей в продакшн нам помогает команда МЛОпс платформы. Многое, что связано с деплоем моделей, уже автоматизировано.

Сейчас у нас несколько команд:

  • Аудитория. Работаем над B2C-продуктами. Персональное ранжирование, рекомендации. Разрабатываем чат-бота для общения с поискунами, который будет в современном формате расспрашивать клиента о его запросах, делать подборки, рекомендовать как быстрее решить свою задачу.
  • Коллтрекинг. Анализируем записи телефонных разговоров поискунов с риелторами, обнаруживаем паттерны, ищем закономерности. В первую очередь работам над поиском спама и прозвона конкурентов для улучшения пользовательского опыта.
  • Оптимизация ценообразования наших платных продуктов. Многорукие бандиты, семплирование Томпсона для поиска оптимальных цен.
  • Модерация контента. Здесь много работаем с картинками (сравниваем их, находим те или иные объекты), много работаем с текстом для поиска и удаления фродового контента или просто случайные ошибки в заполнении.
  • Автоматизация работы клиентской службы. Строим чат-бота, который будет автоматически отвечать на вопросы пользователей о нашем продукте.

Это примерно половина того, что мы делаем, с остальным можно познакомиться в процессе интервью.

Про процессы

  • У нас уже довольно зрелые процессы. Нет большого количества встреч, пишем чистый код, регулярно проводим демо и ретро по итогам квартала. Обмениваемся опытом: проводим внутренние митапы, на которых делимся идеями и советуемся друг с другом. Развиваем собственную MLOps-платформу, на которой реализуем жизненный цикл моделей в продакшн. В команде выстроен процесс грейдирования и постановки личных планов развития.

ML-команда из новостроек

  • Пилит модели поиска скрытого фрода в звонках застройщикам.
  • Определяет склонность пользователей к покупке квартиры в Новостройке.
  • Занимается персонализацией опыта клиентов на сайте.
  • Занимается поиском новых и оптимизацией существующих монетизационных механик (аукцион, динамическая оптимизация).

Мы видим на этой позиции человека, который

  • Имеет В/О: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ и т.п.
  • Пишет легко читаемый и поддерживаемый код на Python.
  • Умеет в SQL на продвинутом уровне — оконные функции, оптимизация запросов.
  • Юзал Apache стек: HDFS/Kafka/PySpark (DF API).
  • Может в классический ML: бустинги, линейные модели.
  • Имеет базовые знания в NLP: трансформеры, TF-IDF.
  • Имеет базовые знания CV: классификация, детекция, сегментация.
  • Знает DL: PyTorch.
  • Понимает ценность MLOps, и ценность переиспользования уже готовых решений внутри компании.
  • Имеет кругозор или непосредственный опыт в реализации проектов для c и b пользователей.
  • Способен самостоятельно коммуницировать с заказчиками и смежниками.

Мы предлагаем

  • Технический рост. У нас есть успешные примеры роста с инженерной точки зрения (разработка, архитектура приложений и сервисов), а так же с точки зрения МЛ: есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов.
  • Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/hard skills на практике, обучении, конференциях.
  • Плюшки: ДМС с первого дня (стоматология, госпитализация, полис ВЗР), ежегодная компенсация спорта, 5 day off в год, помимо основного отпуска.

Этапы интервью

  • Общее знакомство по телефону с рекрутером минут на 15-20.
  • Технические интервью с Тимлидом. Два интервью по 1.5 часа: общее интервью на знания в ML, Python, SQL; дизайн-интервью на проектирование реальной системы.
  • Финал совместно с Head of ML, HR BP. Для нас очень важно взять в команду человека, с котором мы будем сходиться в ценностях. Не готовы здесь уступать даже в случае кандидатов с подходящими навыками и опытом.
  • И, наконец, оффер.

Полезные ссылки

Ирина Ситдикова Remote Recruiter
CIAN

О компании CIAN

Сфера
Продуктовая компания
Инвестиции
Приватное финансирование
Размер
501 - 1000

Циан — крупнейший в России сервис для поиска недвижимости. Компания входит в топ-10 лучших сайтов по недвижимости в мире, ежемесячная аудитория сервиса — свыше 18 млн. человек.

Похожие вакансии

5 000 – 7 000 $/мес на руки
📍 Кипр, Португалия, полная удалёнка, помощь с переездом
350 000 – 500 000 ₽/мес на руки
📍 Москва (м. Кутузовская), офис или гибрид
3 500 – 5 000 €/мес на руки
Полная удалёнка
300 000 – 350 000 ₽/мес на руки
Полная удалёнка
300 000 – 340 000 ₽/мес на руки
Можно удалённо из РФ