← 返回
未分类

淘股吧股票分析精选

爬取淘股吧博客文章获取股市见解。当用户想要订阅或获取 taoguba.cn 的博客内容时调用。
股票爱好者
未分类 community v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 254
下载
💾 37
安装
1
版本
#latest

概述

淘股吧博客爬虫

本技能用于爬取和获取淘股吧(taoguba.cn)的博客文章,淘股吧是中国知名的股市社区。

功能特点

  • 获取特定用户的今日博客文章
  • 获取最新 N 篇博客文章的完整内容
  • 增量订阅(仅获取新文章)
  • 按天数获取历史博客(需要 Cookie)
  • Cookie 认证支持
  • 将内容保存到本地文件

使用方法

基本使用(无需登录)

from scripts.taoguba_crawler import TaogubaBlogCrawler

# 初始化爬虫(使用用户ID)
crawler = TaogubaBlogCrawler('5894557')

# 获取今日博客
blogs = crawler.get_today_blogs(include_content=True)

# 获取最新5篇博客
blogs = crawler.get_latest_blogs(count=5, include_content=True)

# 检查新博客(增量订阅)
blogs = crawler.get_new_blogs(include_content=True)

# 保存到文件
crawler.save_to_file(blogs, 'output.txt')

使用 Cookie 获取历史数据

from scripts.taoguba_crawler import TaogubaBlogCrawler

# 方式1:初始化时传入 Cookie
crawler = TaogubaBlogCrawler('5894557', cookie='your_cookie_string')

# 方式2:运行时设置 Cookie
crawler = TaogubaBlogCrawler('5894557')
crawler.set_cookie_from_browser('your_cookie_string')

# 获取最近7天的博客
blogs = crawler.get_blogs_by_days(days=7, include_content=True)

# 保存到文件
crawler.save_to_file(blogs, 'blog_7days.txt')

直接运行

python scripts/taoguba_crawler.py

运行后显示菜单:

  1. 获取今日博客
  2. 获取最新博客
  3. 检查新博客(增量订阅)
  4. 获取最近N天博客 (需要Cookie)
  5. 设置Cookie
  6. Cookie获取帮助

Cookie 获取方法

方法一:Chrome/Edge 浏览器

  1. 登录 https://www.tgb.cn
  2. 按 F12 打开开发者工具
  3. 切换到 "Network" 标签
  4. 刷新页面
  5. 点击任意请求
  6. 在 Headers 中找到 Cookie 字段
  7. 复制整个 Cookie 值

方法二:使用 EditThisCookie 扩展

  1. 安装 EditThisCookie 浏览器扩展
  2. 登录淘股吧
  3. 点击扩展图标
  4. 点击 "Export" 导出 Cookie

输出文件

  • blog_YYYY-MM-DD.txt - 今日博客
  • blog_latest.txt - 最新博客
  • blog_new.txt - 新博客(增量)
  • blog_Ndays.txt - 最近N天博客
  • cookies.txt - Cookie 缓存文件
  • crawl_history.json - 爬取历史记录

配置说明

编辑脚本中的 user_id 以订阅不同的博主:

user_id = '5894557'  # 淘股吧博主ID

依赖包

pip install requests beautifulsoup4

博客文章结构

每篇博客文章包含:

  • title - 文章标题
  • time - 发布时间
  • link - 原文链接
  • views - 浏览/回复数
  • is_jinghua - 是否为精华帖
  • content - 完整正文内容

API 说明

TaogubaBlogCrawler 类

方法参数说明
------------------
__init__user_id, cookie=None, cookie_file=None初始化爬虫
set_cookie_from_browsercookie_str设置并保存 Cookie
has_cookie-检查是否已设置 Cookie
get_today_blogsinclude_content=True获取今日博客
get_latest_blogscount=5, include_content=True获取最新N篇
get_new_blogsinclude_content=True增量获取新博客
get_blogs_by_daysdays=7, include_content=True获取最近N天博客
save_to_fileblogs, filename=None保存到文件

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-04-09 22:54 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

professional

股票量化分析PRO-双趋势共振量化选股系统GMMA+一目均衡图+ADX+流动性过滤

user_8c7f0f65
双趋势共振量化选股系统,基于GMMA+一目均衡图+ADX+流动性过滤,输出S/A/B/C四级信号与动态止损。支持通达信本地数据和CSV数据扫描。当用户需要量化选股、趋势分析、双趋势共振扫描、股票筛选时调用此技能。
★ 21 📥 3,419
data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 297 📥 141,758
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 211 📥 69,747