# 日语朗读作业批改 - 详细流程与评分规则
## 适用场景
学生提交音频文件(MP3/MP4/M4A/WAV)朗读日语文本,教师需要:
下载 → 转写 → 评分 → 纠错 → 录入成绩 → 生成班级汇总
## 一、作业基础信息
1. 适用对象:A1/A2/B1 日语学习者
# 分级纠错规则(A1 / A2 / B1 独立执行)
JF Can-do / CEFR + JLPT级别参考对应关系
A1 ≈ N5级别
A2 ≈ N4级别
B1 ≈ N3级别
2. 作业形式:朗读音频
3. 总分:10 分
---
## 二、前置准备(Step 0)
1. 标准答案文本存储路径:`./answer/{COURSE_ID}_{ASSIGNMENT_ID}_answer.txt`
2. 文本格式要求:
- 每行 1 个完整句子,无多余空格与换行
- 重点词汇标注假名
- 不含多余标点,便于音频转写对齐
3. 版本校验:批改前确认标准答案与作业要求一致
---
## 三、音频处理流程(Step 1–2)
1. 音频统一格式转换:
- 批量转为 wav 格式,统一采样率
- 存放路径:`./audio/{student_id}/`
2. Whisper 语音转文字:
- 使用 medium 模型,固定不切换
- 输出纯文本文件
- 异常处理规则:
- 音频损坏/空文件/无法识别 → 标记「转写失败」
- 自动移入 `./error_audio/`,触发人工复核
- 跳过自动评分,不直接判定低分
---
## 四、评分规则(核心·鼓励版)
### 4.1 基础分与总分规则
**基础分:10.0 分**
**计分公式:**
总分 = 10.0 - 累计扣分
约束:7.0 ≤ 总分 ≤ 10.0
**扣分上限:3.0 分**(超过不再扣)
---
### 4.2 错误类型与扣分值(仅3类)
| 错误类型 | 扣分 | 说明 |
|----------|------|------|
| 严重发音错误 | **-0.5** | 促音、长音、清浊混淆(三者任一出现) |
| 漏读/多读整句 | **-0.5** | 漏掉一整句 或 多读一整句 |
| 中途中断/长时间停顿 | **-0.5** | 朗读中途放弃,或停顿超过3秒 |
**重要规则:**
- 同一错误类型全篇**只扣一次**,不重复累计
- 上述3类错误若同时出现,累计扣分(最多 -1.5,但扣分上限为 3.0)
> 注:扣分上限 3.0 意味着理论上最多可扣 6 次(每类 2 次),但同一类型只扣一次,所以实际最多扣 1.5 分。此处保留 3.0 上限作为安全边界。
---
### 4.3 不扣分的情况
- 句尾拖音、语气词(よ/ね)
- 「は」vs「わ」、「を」vs「お」等微小识别差异
- 语调轻微偏差、声调轻微偏差
- 语速稍慢或稍快
- 轻微卡顿(≤2处,每处<2秒)
- 拨音(ん)偶尔读不到位(N5/N4 宽容)
- 同一错误类型仅出现一次且不影响语义理解
- 转写存疑、不确定是否为错误 → **不扣分**
---
### 4.4 评分维度(CAF三维框架,每题满分10分)
| 维度 | 权重 | 评分要点 |
|------|------|----------|
| C 复杂性(Complexity) | 80% | 内容贴合与表达复杂度 |
| A 准确性(Accuracy) |10% | 语法、词汇、语音规范 |
| F 流利度(Fluency) | 10% | 话语输出节奏、连贯性、停顿与沉默控制容 |
### 等级划分
| 分数区间 | 等级 |
|---------|------|
| 8.0~10.0 | 优秀 |
| 7.0~7.9 | 良好 |
| 6.0~6.9 | 合格 |
| 6.0以下 | 需加强 |
-
## 五、纠错规则(鼓励导向)
### 5.1 篇幅定义
- 短篇:150字以内
- 长篇:150字以上
### 5.2 纠错上限(按水平+篇幅)
| 学生水平 | 短篇 | 长篇 |
|----------|------|------|
| A1 | 1项 | 2项 |
| A2 | 2项 | 3项 |
| B1 | 2项 | 3项 |
### 5.3 纠错优先级(超过上限时)
1. 影响语义的错误(清浊、长音、促音)
2. 反复出现的高频错误
3. 语调错误
### 5.4 通用纠错原则
- 优先纠正影响语义的关键错误
- 同一错误只纠正一次
- 先表扬优点,再提出改进建议
- 不使用警示符号(如 ⚠),语气鼓励为主
- 转写存疑、不确定的地方不纠错
---
## 六、强制校验流程(防误判)
### 6.1 对齐校验(防止 Whisper 听错导致误判)
批改前,必须逐句比较「Whisper 转写文本」与「标准答案文本」:
- 如果转写文本与标准答案完全一致或仅尾音差异 → 继续批改
- 如果转写文本与标准答案存在假名级别差异(如「学校」→「公園」)→ 该句不扣分,标记「转写存疑,请人工复核」
- 如果转写文本缺失或多余整句 → 跳过该句,标记「可能漏读或多读,请人工复核」
### 6.2 错误判定强制引用表
每个潜在错误必须同时满足以下条件才能判定为对应类型:
| 错误类型 | 必须同时满足的条件 |
|----------|-------------------|
| 促音错误 | ① 标准答案中有「っ」 ② 转写文本中该处完全无「っ」或明显替换为其他音 |
| 长音错误 | ① 标准答案中有长音规则(あ段+あ等) ② 转写文本中该处为短音或断成两拍 |
| 清浊混淆 | ① 标准答案为清音(か/さ/た/は行) ② 转写文本为对应浊音(が/ざ/だ/ば行),或反之 |
| 漏读/跳读 | ① 标准答案中有该假名 ② 转写文本中完全无对应音节 |
---
## 七、报告输出
### 7.1 个人评分报告模板
学生姓名:{name}
【评分结果】
总分:{score}/10
发音准确性:{pronunciation_score}/10
语调与节奏:{intonation_score}/10
流畅度:{fluency_score}/10
【总体评价】
{positive_comment},{constructive_feedback}。{encouragement}
【发音纠错】
学生读法:{student_reading}
标准读法:{correct_reading}({kana})
错误类型:{error_type}
【练习建议】
### 7.2 输出排版规则
- 评分结果、总体评价、发音纠错、练习建议等所有一级反馈大项,必须单独另起一行
- 发音纠错内部用 1、2 数字序号
- 练习建议用 1、2 数字序号
- 不显示等级标注和纠错等级说明
- 禁用 ⚠ 等 emoji
- 评语长度 ≤ 1000 字符(适配平台限制)
- 优先展示优点,再提 1–2 条最关键改进建议
### 7.3 输出文件
- 输出路径:`./report/{student_id}.txt`
---
## 八、批量处理规则
1. 进度文件:`./progress/{course}_{task}_progress.json`
2. 支持中断后继续执行
3. 单次批量 ≤ 50 人,分批处理避免崩溃
4. 失败音频自动标记,不影响整体流程
---
## 九、核心原则
1. **鼓励为主**:从 10 分起评,据实扣分,不刻意压低分数
2. **只纠严重错误**:只纠正影响语义的明显发音错误,微小误差不计
3. **同一错误只扣一次**:不重复扣分
4. **不确定时不判错**:转写存疑或判定不确定时,优先选择不判定为错误
5. **保护信心**:总分不低于 7 分,评语先表扬后建议
共 5 个版本