← 返回
未分类 中文

Text Processor

Batch Chinese text processing — clean, normalize, translate, extract keywords, and format text for content production.
批量中文文本处理——清洗、规范、翻译、提取关键词,并格式化以用于内容生产。
huizong-cpu huizong-cpu 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 268
下载
💾 0
安装
1
版本
#chinese#content#latest#processing#text

概述

Text Processor

A batch text processing utility for content workflows. Handles Chinese text normalization, cleaning, formatting, and structured extraction. Designed for content creators, editors, and automation pipelines.

Features

  • Text cleaning: Remove extra whitespace, fix punctuation, normalize quotes
  • Chinese normalization: Convert full-width/half-width, simplify/traditional
  • Batch processing: Process multiple text items in one call
  • Format conversion: Markdown ↔ plain text, numbered lists, tables
  • Keyword extraction: Extract key terms and phrases from Chinese text

Usage

const processor = require('./skills/text-processor');

// Clean and normalize
const cleaned = processor.clean("  Hello,世界!  This has ”bad” quotes.  ");
// → "Hello,世界!This has "bad" quotes."

// Extract keywords from Chinese text
const keywords = processor.extractKeywords("今天天气很好,适合出去郊游");
// → ["天气", "郊游", ...]

// Batch process
const results = processor.batch([
  "  文本1  ",
  "  文本2  "
], 'clean');
// → ["文本1", "文本2"]

API

clean(text)

Normalize and clean Chinese/English mixed text:

  • Trim whitespace
  • Collapse multiple spaces
  • Normalize quotes («»「」"" → standard "")
  • Normalize full-width/half-width punctuation

extractKeywords(text, maxCount?)

Extract meaningful keywords from Chinese text using TF heuristics.

batch(items, operation, options?)

Process an array of texts with the same operation.

License

MIT

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-23 16:44 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

GPT-SoVITS TTS

huizong-cpu
使用GPT-SoVITS v2 Pro+的高质量中文TTS,支持文本转自然语音和声音克隆。
★ 0 📥 322
content-creation

Humanizer

biostartechnology
消除AI写作痕迹,使文本更自然真实。基于维基百科"AI写作特征"指南,识别并修正夸张象征、宣传用语、肤浅-ing分析、模糊归因、破折号滥用、三项排比、AI词汇、负面平行结构及冗长连接词等模式。
★ 906 📥 206,742
content-creation

humanizer-zh

liuxy951129-cpu
去除文本中的 AI 生成痕迹。适用于编辑或审阅文本,使其听起来更自然、更像人类书写。 基于维基百科的"AI 写作特征"综合指南。检测并修复以下模式:夸大的象征意义、 宣传性语言、以 -ing 结尾的肤浅分析、模糊的归因、破折号过度使用、三段
★ 61 📥 29,387