requests、beautifulsoup4调用脚本对目标 URL 发起多 UA 请求,收集各 UA 下的响应:
python scripts/fetch_multi_ua.py --url "https://example.com" --timeout 15 --delay 0.5
参数说明:
--url(必填):目标 URL,支持 http/https,缺少协议时自动补 http--timeout(可选):单次请求超时秒数,默认 15--delay(可选):请求间隔秒数,默认 0.5(避免触发限流)--ua-filter(可选):指定 UA 子集,逗号分隔,如 googlebot,chrome_desktop可用 UA 名称:googlebot bingbot baiduspider chrome_desktop firefox_desktop safari_mac chrome_android safari_ios curl python_requests empty_ua
脚本输出 JSON,重点关注:
none/low/medium/high)根据脚本返回的差异摘要,智能体执行以下分析:
content_snippet 或 plain_text_snippet,识别具体违规内容(赌博、色情、诈骗等关键词)redirect_groups,判断是否存在 UA 针对性跳转生成结构化报告,包含:
googlebot/baiduspider 与 chrome_desktop 的响应,定位差异点page_title 和 plain_text_snippet,判断是否为 UA 针对性投放--ua-filter googlebot,bingbot,baiduspider 缩小检测范围--url 必填,--timeout/--delay/--ua-filter 可选)--timeoutallow_redirects=True),重定向目标会记录在 redirect_url 和 redirect_history 中content_snippet 截取前 2000 字符,plain_text_snippet 截取前 1500 字符纯文本,足够初步判断共 1 个版本