A powerful skill for searching and extracting data from Yandex.Archive (Яндекс.Архив) using Scrapling to bypass bot protection and Cloudflare Turnstile.
Scrapling (StealthyFetcher) to bypass Yandex bot protection.
archive (Архивы) — Metric books, revision tales, confessional statements.
mass_media (Периодика) — Old newspapers (e.g., "Senate Gazette", "Provincial Gazette").
directories (Справочники) — Address calendars, lists of residents, memorable books.
yandex_archive_search
Search Yandex.Archive based on a natural language query.
Parameters:
query (string): The search query (e.g., "Александр Пушкин Москва").
index (string, optional): The index to search in. Options: archive (default), mass_media, directories.
max_pages (integer, optional): Maximum number of pages to scrape (default 1).
scrapling
playwright
curl_cffi
patchright
msgspec
browserforge
Мощный скилл для поиска и извлечения данных из Яндекс.Архива с использованием фреймворка Scrapling для обхода защиты от ботов и Cloudflare Turnstile.
Scrapling (StealthyFetcher) для обхода защиты Яндекса.
archive (Архивы) — Метрические книги, ревизские сказки, исповедные ведомости.
mass_media (Периодика) — Старые газеты (например, "Сенатские ведомости", "Губернские ведомости").
directories (Справочники) — Адрес-календари, списки жителей, памятные книжки.
yandex_archive_search
Поиск по Яндекс.Архиву на основе текстового запроса.
Параметры:
query (string): Поисковый запрос (например, "Александр Пушкин Москва").
index (string, optional): Раздел для поиска. Варианты: archive (по умолчанию), mass_media, directories.
max_pages (integer, optional): Максимальное количество страниц для парсинга (по умолчанию 1).
scrapling
playwright
curl_cffi
patchright
msgspec
browserforge共 1 个版本