← 返回
未分类

baidu_search

Perform Baidu search to retrieve Chinese web results with titles, summaries, and links, and parse webpage content from search results.
执行百度搜索获取中文网页结果(包括标题、摘要、链接),并解析搜索结果中的网页内容。
chaoking chaoking 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 312
下载
💾 1
安装
1
版本
#latest

概述

Baidu Search

使用 baidusearch 库进行百度搜索,并支持解析搜索结果网页内容。

Quick Start

1. 百度搜索

from baidusearch.baidusearch import search

# 基础搜索(默认返回10条结果)
results = search('搜索关键词')

# 指定返回结果数量
results = search('搜索关键词', num_results=20)

返回结果格式:

[
    {
        'title': '结果标题',
        'abstract': '结果摘要',
        'url': '结果链接',
        'rank': 1
    },
    ...
]

2. 解析网页内容

from scripts.fetch_url import fetch_url

# 获取并解析网页内容
content = fetch_url('http://example.com/article')
print(content['title'])
print(content['text'])

3. 搜索并解析完整流程

from baidusearch.baidusearch import search
from scripts.fetch_url import fetch_url

# 第一步:搜索
results = search('南京江宁龙虾政策', num_results=5)

# 第二步:解析第一条结果的网页内容
if results:
    first_url = results[0]['url']
    content = fetch_url(first_url)
    print(f"标题: {content['title']}")
    print(f"正文: {content['text'][:500]}...")

命令行使用

搜索:

python3 scripts/baidu_search.py "搜索关键词" --num 10

解析网页:

python3 scripts/fetch_url.py "http://example.com"
python3 scripts/fetch_url.py "http://example.com" --max-chars 2000

搜索并解析(完整流程):

python3 scripts/search_and_fetch.py "搜索关键词" --num 5

Workflow

  1. 安装依赖: 确保已安装所需库

```bash

pip3 install --user baidusearch requests beautifulsoup4 lxml

```

  1. 执行搜索: 使用 baidusearch 获取搜索结果
  1. 解析网页: 使用 fetch_url 解析搜索结果中的网页内容
  1. 注意事项:
    • 建议每次搜索间隔 15 秒以上
    • 频繁使用可能导致 IP 被百度封禁
    • 遇到 503 错误请等待 1 分钟后重试
    • 部分网站可能有反爬机制,解析可能失败

Resources

scripts/

  • baidu_search.py - 百度搜索脚本,支持命令行参数调用
  • fetch_url.py - 网页内容抓取和解析脚本
  • search_and_fetch.py - 搜索并自动解析网页内容的完整流程脚本

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 11:47

安全检测

腾讯云安全 (Keen)

队列中

腾讯云安全 (Sanbu)

队列中

🔗 相关推荐

data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 211 📥 69,736
data-analysis

Stock Watcher

robin797860
管理和监控个人股票自选列表,支持利用同花顺数据添加、删除、列出股票及汇总近期表现。适用于用户希望追踪特定股票、获取表现汇总或管理自选列表时。
★ 112 📥 46,616
data-analysis

Tavily 搜索

jacky1n7
通过 Tavily API 进行网页搜索(Brave 替代方案)。当用户要求搜索网页、查找来源或链接,且 Brave 网页搜索不可用时使用。
★ 273 📥 100,765