Задание: Python. Аналитический обзор рынка услуг сиделок в Новосибирске (Дистанционная работа)
Название: Аналитический обзор рынка услуг сиделок в Новосибирске
Описание задачи:
Необходимо подготовить структурированную статистическую выборку по предложениям услуг сиделок в Новосибирске на основе открытых интернет-площадок.
Цель исследования: Выявить зависимость цены услуги от ключевых характеристик исполнителя (возраст, опыт, наличие медицинских навыков, готовность к проживанию, район).
Площадки для мониторинга (Новосибирск):
Яндекс Услуги
Профи.ру
7hands.com
Помогатель.ру
Avito.ru (раздел "Няни/сиделки")
Opeca-doma.ru (только тарифы агентства)
Что фиксировать для каждой позиции:
Поле Формат Примечание
Источник Текст Название площадки
Цена за час Число Если указана. Если диапазон — взять нижнюю границу
Цена за месяц Число Если указана. Если диапазон — взять нижнюю границу
Возраст Число Из анкеты/профиля
Опыт работы Число (лет) Если "без опыта" → 0. Если "от 10 лет" → 10
Наличие медицинских навыков 0/1 По тексту: есть ли слова "уколы", "инъекции", "массаж", "реабилитация", "медсестра"
Готовность к проживанию 0/1 Если в тексте явно указано "с проживанием" или "готов жить"
Район Текст Если указан. Если нет — пропуск
Текст описания услуг (без контактных данных) Текст Только описание навыков и обязанностей. Телефоны, email, ссылки — удалить
Важно: Исполнитель не передаёт и не сохраняет контактные данные (телефон, email, ссылки на соцсети, адреса) из текста объявлений. Перед выгрузкой все такие данные должны быть удалены из поля с текстом. Это обязательное условие для соблюдения политики платформы.
Технические требования:
Собрать все доступные позиции с каждой площадки (не ограничиваясь первыми страницами).
Для площадок с динамической подгрузкой (кнопка "показать ещё") — обеспечить полную выгрузку.
Для Avito.ru — обеспечить доступ к данным с учётом технических ограничений площадки (исполнитель определяет метод самостоятельно).
Данные должны быть собраны однократно в течение 48 часов, чтобы обеспечить срез рынка на конкретную дату.
Особое указание по opeca-doma.ru:
Это сайт агентства. Для него выгрузить тарифы (приходящая, суточная, с проживанием) как отдельные строки с пометкой в поле "Источник" — "Опека (агентство)".
Формат результата:
Единый файл в формате .csv (кодировка UTF-8, разделитель — запятая).
Первая строка — заголовки: source, price_hour, price_month, age, experience_years, has_medical_skills, live_in, district, text_full.
Файл должен быть доступен для скачивания по ссылке (Google Диск / Яндекс.Диск) или вложен в сообщение.
Критерии приёмки:
В файле присутствуют все заявленные колонки.
Количество записей: не менее 150 в совокупности по всем площадкам (с учётом 6 источников).
Выборочная проверка (10 случайных записей) на соответствие данным на источниках — допустимое расхождение не более 10% по ценовым полям.
В файле нет явных дублей (одинаковые источник + возраст + цена).
Для каждой записи заполнены как минимум: источник, цена (час или месяц), возраст, опыт.
Срок выполнения: 48 часов с момента подтверждения заказа. Старт — 22 июня 2026, дедлайн — 24 июня 2026, 23:59 МСК.
Бюджет: 12 000 руб (фиксированная цена).
Дополнительно: Исполнитель предоставляет краткий лог-файл со статистикой собранных данных (количество записей по каждому источнику, диапазон цен, количество пропусков по ключевым полям). Это необходимо для подтверждения объёма выполненной работы.