← 返回
未分类

Douyin Hot Scraper

爬取抖音热榜和搜索数据,支持自然语言搜索请求如"搜索一下海鲜视频"、"看看抖音热榜
抓取抖音热榜和搜索数据,支持自然语言搜索请求,如“搜索海鲜视频”、“查看抖音热榜”
terrycarter1985 terrycarter1985 来源
未分类 clawhub v2.0.1 1 版本 100000 Key: 无需
★ 0
Stars
📥 66
下载
💾 0
安装
1
版本
#latest

概述

抖音数据爬虫 Skill

功能概述

获取抖音热榜数据和关键词搜索结果。

功能特性

  • 🔥 热榜获取 - 获取抖音实时热搜榜(公开 API,无需登录)
  • 🔍 关键词搜索 - 按关键词搜索抖音视频(Playwright 浏览器自动化 + API 回退)
  • 📝 文案提取 - 提取视频标题、描述、标签等
  • 🎬 数据统计 - 获取播放量、点赞数、评论数等

自然语言调用

当用户用自然语言表达搜索意图时,直接调用,无需用户手动指定命令。

识别模式

用户说动作命令
--------------------
搜索一下海鲜视频搜索python3 scripts/scraper.py search --keyword "海鲜" --limit 10
看看抖音热榜热榜python3 scripts/scraper.py hot --limit 20
找一些关于小龙虾的视频搜索python3 scripts/scraper.py search --keyword "小龙虾" --limit 10
抖音最近什么火热榜python3 scripts/scraper.py hot --limit 20
帮我搜一下美食搜索python3 scripts/scraper.py search --keyword "美食" --limit 10

关键词提取规则

  1. 从用户自然语言中提取核心搜索词
  2. 去掉"视频"、"一下"、"一些"等无意义词
  3. 保留具体品类/主题词(如"海鲜"、"小龙虾"、"美食")
  4. 如果用户指定数量,使用 --limit;否则默认 10

依赖

Playwright 和 Chromium 浏览器。首次使用前运行:

pip install playwright && playwright install chromium

使用方法

搜索关键词

# 基本搜索
python3 scripts/scraper.py search --keyword "海鲜" --limit 10

# 仅使用热榜 API(更快,无需浏览器)
python3 scripts/scraper.py search --keyword "海鲜" --method api --limit 10

# 搜索并保存结果
python3 scripts/scraper.py search --keyword "海鲜售卖" --limit 20 --output seafood.json

获取热榜

# 获取热榜
python3 scripts/scraper.py hot --limit 20

# 保存热榜数据
python3 scripts/scraper.py hot --limit 50 --output hot.json

搜索方式说明

方式说明适用场景
----------------------
auto(默认)先尝试浏览器搜索,失败则回退热榜 API通用
api仅使用热榜 API,按关键词过滤快速获取,无需浏览器
browser仅使用 Playwright 浏览器需要精确搜索结果

> ⚠️ 抖音网页版搜索需要登录。如果未登录,auto 模式会自动回退到热榜 API。

输出数据格式

JSON

[
  {
    "title": "视频标题",
    "description": "视频描述",
    "author": "作者昵称",
    "play_count": 1000000,
    "like_count": 50000,
    "comment_count": 2000,
    "share_count": 1000,
    "url": "https://www.douyin.com/video/xxx",
    "tags": ["标签1", "标签2"],
    "publish_time": "2026-06-08",
    "hot_value": 5000000
  }
]

注意事项

  1. 遵守平台规则 - 合理使用,避免频繁请求
  2. 数据用途 - 仅供学习和研究
  3. 搜索限制 - 抖音网页搜索需登录,未登录时回退到热榜数据
  4. 请求间隔 - 建议搜索间隔 ≥ 5 秒

技术架构

  • 热榜 API: https://www.douyin.com/aweme/v1/web/hot/search/list/ — 公开接口,无需登录
  • 搜索: Playwright 浏览器自动化 → 抖音搜索页 → 提取 SSR/DOM 数据 → 回退热榜 API

版本历史

共 1 个版本

  • v2.0.1 当前
    2026-06-09 19:21

安全检测

腾讯云安全 (Keen)

队列中

腾讯云安全 (Sanbu)

队列中

🔗 相关推荐

Stock Price Alert

terrycarter1985
股价异动实时提醒,支持行情接口、邮件和Sonos语音播报
★ 0 📥 683

Stock Alert Workflow

terrycarter1985
使用 Yahoo Finance 数据分析股票和加密货币,支持投资组合管理(创建、添加、移除资产),以及按市值排名前 20 的加密货币分析。
★ 0 📥 574

Code Formatter

terrycarter1985
代码格式化最佳实践及常用语言(Python、JavaScript、JSON、Markdown 等)的快速参考,使用 Prettier、Black、ESLint 等工具。
★ 0 📥 634