# 案例：长文档与法律文书提示词

日期：2026-06-10

本文件是场景案例，不是主线第三讲。建议先学习 `../../核心课程/01-现代提示词工程总论.md` 和 `../../核心课程/02-从提示词到上下文工程.md`，再用本案例练习“先抽取、再总结、再核查”的长文档流程。

## 一、直觉

长文档总结最怕两件事：

1. 模型只看开头和结尾，漏掉中间关键内容。
2. 模型把“原文写了什么”和“自己推断了什么”混在一起。

法律文书更严格，因为金额、日期、主体、诉讼请求和判决主文不能错。成熟做法不是直接让模型“总结”，而是分三步：

```text
抽取事实 -> 归纳结构 -> 核查风险
```

## 二、长文档处理流程

### 第一步：识别文档结构

先让模型判断文档类型和结构。

```text
请先识别这份文档的类型和主要结构，不要开始总结。输出：
1. 文档类型
2. 主要章节或组成部分
3. 可能的关键字段
4. 需要特别核查的内容
```

对于判决书，结构通常包括：

- 案件基本信息。
- 当事人信息。
- 原告诉称。
- 被告辩称。
- 法院查明。
- 法院认为。
- 判决主文。
- 诉讼费用。

### 第二步：字段抽取

先抽取硬信息，减少后面总结出错。

字段包括：

- 案号。
- 法院。
- 裁判日期。
- 案由。
- 原告、被告、第三人。
- 诉讼请求。
- 关键金额。
- 关键日期。
- 判决主文。
- 履行期限。
- 费用承担。

### 第三步：分区总结

法律文书必须分清不同来源：

- “原告诉称”是原告主张，不等于法院认定。
- “被告辩称”是被告抗辩，不等于法院采信。
- “法院查明”是法院认定事实。
- “法院认为”是裁判理由。
- “判决如下”是最终结果。

提示词里要明确禁止混同。

### 第四步：争议焦点归纳

争议焦点不是简单复述案情，而是双方真正争的法律或事实问题。

常见类型：

- 合同是否成立或有效。
- 是否履行主要义务。
- 是否违约或侵权。
- 损失金额如何认定。
- 责任由谁承担。
- 利息、违约金、费用是否支持。

### 第五步：输出前核查

总结后再让模型做核查：

- 判决主文是否逐项列出。
- 金额是否和原文一致。
- 日期是否和原文一致。
- 是否遗漏诉讼费。
- 是否把当事人主张写成法院认定。
- 是否出现原文没有的法律建议。

## 三、判决书专用高质量提示词

```text
你是一名严谨的法律文书分析助手。请只基于我提供的民事判决书原文进行分析，不补充案外事实，不把任何一方主张直接当作法院认定，不提供正式法律意见。

# 工作流程
请按以下步骤处理：
1. 先识别文书结构。
2. 再抽取案号、法院、日期、案由、当事人、金额、诉讼请求、判决主文等硬信息。
3. 然后按“原告诉称、被告辩称、法院查明、法院认为、判决结果”分区总结。
4. 最后进行一致性核查，列出需要人工复核的问题。

# 重要规则
- 只基于原文。
- 原文未载明的信息写“原文未载明”。
- 金额、日期、案号、法院、当事人名称尽量按原文摘录。
- 如果存在多个请求、多个被告、多个法律关系或多项判决，必须分别列出。
- 不要把诉讼请求写成判决结果。
- 不要把被告抗辩写成法院认定。
- 不要把法院没有支持的请求写成已支持。
- 不要给出“必然胜诉/败诉”之类结论。

# 输出结构
一、文书结构识别

二、案件基本信息
- 案号：
- 审理法院：
- 裁判日期：
- 案由：
- 审理程序：
- 原告：
- 被告：
- 第三人：

三、关键字段抽取
- 关键金额：
- 关键日期：
- 涉及合同或法律关系：
- 诉讼费用：
- 履行期限：

四、原告诉称

五、被告辩称

六、法院查明事实
请按时间顺序列出。

七、争议焦点
请归纳 2-5 个真正争议点。

八、法院裁判理由
按争议焦点分别说明法院为何支持或不支持。

九、判决结果
逐项列出判决主文，包括支付义务、履行期限、驳回请求、费用承担。

十、一致性核查
请检查：
- 是否遗漏任一诉讼请求。
- 是否遗漏任一判决主文。
- 金额、日期、主体是否需要人工复核。
- 是否存在原文未载明但可能影响理解的信息。

十一、极简摘要
用 150 字以内概括：谁告谁、因为什么、法院怎么判。

<judgment>
在这里粘贴判决书全文
</judgment>
```

## 四、特别长的判决书怎么处理

如果文书超过模型一次能稳定处理的长度，使用分段法。

### 第一轮：分段抽取

```text
你将收到判决书的第 [n] 段。请只处理本段，不要总结全文。

输出：
1. 本段属于文书哪个部分。
2. 本段出现的主体、日期、金额。
3. 本段关键事实。
4. 本段可能影响最终判决的内容。
5. 本段无法判断但需后续合并时注意的问题。

<segment index="[n]">
粘贴本段
</segment>
```

### 第二轮：合并总表

```text
下面是各段抽取结果。请合并为一份总表。

要求：
1. 合并重复主体、日期、金额。
2. 标记段落之间的矛盾或需要复核处。
3. 不要新增各段中没有的信息。

<segment_notes>
粘贴各段抽取结果
</segment_notes>
```

### 第三轮：总总结

```text
请基于合并后的总表和原始关键段落，生成最终结构化总结。若总表与原文关键段落冲突，以原文关键段落为准，并标注需要人工复核。
```

## 五、法律文书输出的风险控制

### 1. 不要直接问“我能不能赢”

这会诱导模型给出过度确定的法律判断。更好的问法：

```text
请基于判决书原文，总结法院支持和不支持各项请求的理由，并列出可能影响上诉或执行的事实点。不要给出确定性胜败预测。
```

### 2. 要保留依据

如果用于复核，要求模型列出“原文依据摘要”。

```text
每个关键结论后，请用一句话说明其原文依据来自哪一部分，例如“法院认为部分”“判决主文部分”。
```

### 3. 重要事项必须人工复核

这些内容不能只信模型：

- 上诉期限。
- 履行期限。
- 金额和利息计算。
- 判决主文。
- 执行风险。
- 是否需要申请再审、抗诉或另案起诉。

AI 可以做阅读辅助，不能替代律师或当事人的正式判断。

## 六、长文档总结的通用模板

```text
你是一名严谨的长文档分析助手。请只基于输入文档完成总结。

# 任务
对文档进行结构化总结，并提取所有关键事实、数字、日期和风险点。

# 规则
1. 只基于原文，不补充外部事实。
2. 原文未载明写“原文未载明”。
3. 区分事实、观点、结论和建议。
4. 保留关键数字、日期、主体、条件。
5. 如果文档内部存在矛盾，请标注。
6. 输出前检查是否遗漏文档结尾处的决定、结论、费用、期限或附件说明。

# 输出
一、文档类型和结构
二、核心结论
三、关键事实表
四、时间线
五、主体关系
六、数字和金额汇总
七、风险点和待复核问题
八、200 字以内摘要

<document>
粘贴文档全文
</document>
```

## 七、常见误区

### 误区 1：直接让模型总结全文

如果文档长、结构复杂，直接总结容易遗漏。先抽取字段，再总结更稳。

### 误区 2：不区分来源

法律文书里最危险的错误是把“当事人说”写成“法院认定”。

### 误区 3：不要求保留硬信息

金额、日期、案号、履行期限、费用承担必须单独抽取。

### 误区 4：不设置拒答和不确定

原文没有的信息必须允许模型写“原文未载明”，否则模型可能补全。

## 八、理解检查

1. 为什么法律文书总结要先抽取硬信息？
2. “原告诉称”和“法院查明”有什么区别？
3. 判决书总结中最需要人工复核的五类信息是什么？
4. 超长文档为什么要先分段抽取再合并？
5. 为什么不建议直接问 AI“我能不能赢”？

## 九、练习

找一份你可以公开处理的判决书或合同，先不要让 AI 总结全文。按下面三步练习：

1. 让 AI 识别文档结构。
2. 让 AI 抽取关键字段。
3. 再让 AI 做最终总结和一致性核查。

记录哪个阶段最容易出错，下次我们可以针对这个失败点继续改提示词。