← 返回
未分类

Corpus Search

语料检索工具,与 corpus-builder 配合使用。支持语义搜索、元数据过滤(场景/情绪/节奏/质量)。Use when: 需要搜索语料库中的小说片段、按场景类型过滤、查找特定情绪/节奏的描写、检索高质量写作素材。
语料检索工具,与 corpus-builder 配合使用。支持语义搜索、元数据过滤(场景/情绪/节奏/质量)。Use when: 需要搜索语料库中的小说片段、按场景类型过滤、查找特定情绪/节奏的描写、检索高质量写作素材。
yuzhihui886 yuzhihui886 来源
未分类 clawhub v1.0.1 1 版本 99703.3 Key: 无需
★ 0
Stars
📥 336
下载
💾 0
安装
1
版本
#latest

概述

Corpus Search - 语料检索工具

与 corpus-builder 配合使用的语料检索工具,支持语义搜索和元数据过滤。

快速开始

cd ~/.openclaw/workspace/skills/corpus-search

# 基础搜索
python3 scripts/search_corpus.py -q "紧张的打斗场景" -c xuanhuan-full --limit 10

# 按场景过滤
python3 scripts/search_corpus.py -q "围攻" -c xuanhuan-full --scene 打斗 --limit 5

# 按情绪过滤
python3 scripts/search_corpus.py -q "修炼" -c xuanhuan-full --emotion 紧张 --limit 10

# JSON 输出
python3 scripts/search_corpus.py -q "突破" -c xuanhuan-full --json

命令行选项

选项说明
------------
-q, --query搜索查询(必填)
-c, --collection语料库名称(必填)
--limit返回数量(默认 10)
--scene场景过滤(打斗/修炼/对话/探险等)
--emotion情绪过滤(紧张/轻松/悲伤/热血等)
--min-quality最低质量分(1-10)
--jsonJSON 格式输出
--export导出到文件
--verbose详细输出

输出示例

🔍 搜索结果:紧张的打斗场景
   语料库:xuanhuan-full
   返回数量:5

1. 相似度:87.5%
   场景:打斗
   情绪:紧张,热血
   节奏:快节奏
   来源:没钱修什么仙_第 1-10 章.txt

   内容预览:
   张羽只觉胸口一痛,低头看去,只见一柄长剑已刺入...

依赖

pip3 install -r requirements.txt --user

配置

编辑 configs/default_config.yml 修改语料库路径。

相关文件

  • scripts/search_corpus.py - 主程序
  • configs/default_config.yml - 配置文件

Version: 1.0.0

版本历史

共 1 个版本

  • v1.0.1 当前
    2026-05-07 11:50 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

Novel Scraper

yuzhihui886
智能小说抓取工具,自动翻页、分页补全、章节号解析。使用 curl+BeautifulSoup 抓取笔趣阁等网站,输出格式化 TXT;每 10 章合并为一份文档,自动跳过作者感言、抽奖等非正文内容。适用于批量抓取网络小说章节。
★ 5 📥 1,236

Outline Generator

yuzhihui886
小说大纲生成器。根据小说类型、主题、字数生成15节拍结构化大纲。使用场景:Architect 代理在 Phase 1 需要生成故事大纲、规划15节拍结构、创建卷章框架。
★ 1 📥 439

Character Manager

yuzhihui886
小说角色管理工具。创建、编辑、查询角色档案;支持角色关系网络、情感弧线、动机追踪。适用场景:Architect 代理在 Phase 3 需创建角色档案、管理角色关系、追踪角色成长轨迹。
★ 0 📥 599