Парсинг цен онлайн-аптек (Eapteka, Apteka ru, Ozon)
Цель:
Получить CSV с актуальными ценами на лекарства, БАДы и медтовары из интернет-аптек.
Данные нужны для анализа ценовой политики поставщиков.
Гео:
Москва (все цены для Москвы, но возможность переключить регион).
Сайты для парсинга:
Eapteka.ru
Apteka.ru
Ozon.ru (раздел аптека)
Объем: 1000 наименований в каждой аптеке с ежедневным обновлением
Что нужно собирать (поля в CSV):
Название – название препарата с дозировкой (например, Фенибут 250 мг).
Цена – минимальная цена (в рублях, без знака , без пробелов).
Аптека – Eapteka.ru / Apteka.ru / Ozon.ru.
Ссылка – прямая ссылка на товар.
Бренд – производитель (если нет – Уточняйте на сайте).
Упаковка – количество таблеток/капсул/мл (если нет – пусто).
Город – Москва.
Важно:
Собрать только самую дешевую упаковку для каждого товара из каждой аптеки.
Товары без наличия пропускать.
Если бренд не указан – писать Уточняйте на сайте.
CSV должен быть отсортирован по цене от меньшей к большей
Результат:
CSV-файлы по каждой аптеке (по FTP):
/csv/eapteka/eapteka.csv
/csv/aptekaru/aptekaru.csv
Формат CSV:
Название,Цена,Аптека,Ссылка,Бренд,Упаковка,Город
Фенибут 250 мг,150,eapteka.ru,ссылка,ОЗОН,20 табл,Москва
Чем парсить:
Любой инструмент (BAS, Zennoposter, Python и т. д.), важно корректно собрать данные.
Поддержка прокси.
Поддержка антикапчи (рукапча).
Ожидаю от вас:
Примеры ваших парсингов.
Опыт работы с маркетплейсами
Сроки выполнения.
Дополнительно:
Возможна защита (капчи, блокировки) работа с прокси, мобильными IP, антикапчей
Скрипты и боты