概述
给定一份中文门诊 复诊病历文本(医生已书写),本技能抽取并规范化为细粒度字段 JSON,例如:
数据安全、隐私与伦理声明
输入格式
纯文本病历(UTF-8),可包含如下分段:
主诉:……
现病史:……
既往史:……
婚育史:……
月经史:……
个人史:……
家族史:……
查体:……
辅助检查:……
诊断:……
处理:……
也支持通过统一入口 scripts/run.py 直接输入 pdf/doc/docx/xls/xlsx/csv/txt/json。
预处理成功后,会先归一化为标准复诊病历文本,再调用本 skill 的原始结构化逻辑。
快速开始
# JSON 结构化输入
python doctor/emr-gen/followup-record/scripts/run.py \
--input data/med-followup-record/gen_records.json \
--appkey <your-appkey>
# 普通病历文件(纯文本)
python doctor/emr-gen/followup-record/scripts/run.py \
--input data/med-followup-record/record.txt \
--appkey <your-appkey>
参数说明
--input PATH:必填。输入 JSON 文件或病历文本文件路径。--input-type auto|pdf|doc|docx|xls|xlsx|csv|txt|json:输入类型,默认 auto。--sheet STRING:读取 Excel 时指定 sheet(可选)。--encoding STRING:txt/csv 编码,默认 utf-8。--base URL:内部大模型 base URL,默认 https://maas-api.hivoice.cn/v1。--model STRING:模型名称,默认 u1-insuremed。--timeout SECONDS:HTTP 超时秒数;0 表示一直等待,默认 0。--appkey STRING:必填。内部医疗大模型鉴权 key,使用 Bearer 方式认证。--output-json PATH:可选。保存输出 JSON。--output PATH:可选:输出病历文本文件路径。--save-prepared:可选:保存预处理后的文本,便于调试。输出约定
字段:值未提及无依赖
scripts/run.py 依赖 _shared/doc-preprocess 提供的公共文件预处理库(preprocess.py)。
请确保 _shared/doc-preprocess/ 位于 skills/ 根目录下。
https://maas-api.hivoice.cn/v1/chat/completions--appkey 参数进行 Bearer 认证| 包名 | 用途 | 必要条件 |
|---|---|---|
| ------ | ------ | --------- |
openpyxl | 读取 .xlsx 文件 | 输入为 xlsx 时必须 |
pypdf | 提取 PDF 文本 | 输入为 pdf 时必须 |
安装:pip install openpyxl pypdf
> 仅使用 TXT/JSON 输入时,无需安装任何额外包。
测试命令
从 skills 根目录执行:
# 离线自测(检查输入和构造请求)
python self_tests/med-followup-record-gen/self_test_followup_record_gen.py
# 在线自测(调用内部接口)
python self_tests/med-followup-record-gen/self_test_followup_record_gen.py --run-network
共 1 个版本
暂无安全检测报告