Резюме: Data Scientist / Программный лингвист
Краткое резюме
Data Scientist и программный лингвист с магистерской степенью (МАИ) и более 6 лет опыта в анализе текстовых данных. Специализация — разработка и сопровождение rule‑based и гибридных текстовых классификаторов (RU/EN), построение тезаурусов, предобработка и нормализация корпусов, валидация эталонов. Ищу позицию Data Scientist / NLP‑специалиста. Желаемая зарплата: 100 000–130 000 руб. Переезд: нет. Занятость: полная, гибкий график.
Ключевые навыки
Языки: Python (ур. Junior) — скрипты обработки, автоматизация; SQL (ур. Junior)
NLP: токенизация, лемматизация, стоп‑слова, регулярные выражения, построение тезаурусов, rule‑based классификация (ScatQL)
Процессы: сбор и нормализация данных, разметка эталонов, валидация подборок, тестирование правил
Инструменты: MS Excel, работа с открытыми источниками, базовые навыки Git, обработка текстов
Языки: Русский (родной), Английский B2
Опыт работы
ООО «ЛАН‑ПРОЕКТ», Москва
Программист (старший лингвист) — февраль 2019 — октябрь 2025
Сбор и нормализация разрозненных открытых источников (новости, статьи, стандарты) для единого корпуса.
Разработка и внедрение правил отбора и запросов на ScatQL для автоматической классификации текстов по эталонным подборкам.
Создание и расширение тезаурусов и лексиконов для русскоязычных и англоязычных классификаторов.
Отладка и сопровождение текстовых классификаторов: исправление ложных срабатываний, оптимизация фильтров, обновление правил.
Ручная разметка и валидация эталонных документов; взаимодействие с заказчиками по уточнению требований.
Johnson & Johnson
Координатор документооборота — май 2018 — февраль 2019
Подготовка пакетов договорных документов, выставление счетов, отправка через ЭДО; контроль возврата и полноты документов.
Образование
МАИ — Магистр, Прикладная математика (Компьютерные науки и прикладная математика), 2018