Напишу парсер для извлечение различных данных с других сайтов.
Данные складываю в форматы JSON, CSV, XML, txt и другие.
Если вам нужен парсер который будет постоянно обновлять информацию, опишите это, пожалуйста, в задаче. В этом случае я настрою вам сервер и перенесу скрипт туда.
Под задачи вашего проекта можно сделать:
Какие сайты возможно парсить? Любые. Начиная с небольших интернет-магазинов, заканчивая огромными - Яндекс Маркет, Алиэкспресс, поисковые системы и прочие. Есть редкие небольшие сайты, в которых все страницы разные и заполняются кустарным способом, здесь можно только спарсить статью целиком. Но в целом все сайты сейчас используют системы управления контентом CMS, в которых страницы оформлены по стандарту и заголовок, описание и прочее оформлены определенными тегами.
Многопоточный или Мультипроцессорный парсер
Полная имитация браузера в сложных проектах
Сохранение результатов в разные типы данных:
TXT
CSV
XLSX
JSON
Сохранение данных в базу данных вашего приложения(сайта)
Загрузка любых типов данных (изображения, видео, документов)
Сайты с капчей, включая Recaptcha от Google.
Поддержка прокси ipv4 и ipv6