案例：长文档与法律文书提示词

日期：2026-06-10

本文件是场景案例，不是主线第三讲。建议先学习 ../../核心课程/01-现代提示词工程总论.md 和 ../../核心课程/02-从提示词到上下文工程.md，再用本案例练习“先抽取、再总结、再核查”的长文档流程。

一、直觉

长文档总结最怕两件事：

模型只看开头和结尾，漏掉中间关键内容。
模型把“原文写了什么”和“自己推断了什么”混在一起。

法律文书更严格，因为金额、日期、主体、诉讼请求和判决主文不能错。成熟做法不是直接让模型“总结”，而是分三步：

抽取事实 -> 归纳结构 -> 核查风险

二、长文档处理流程

第一步：识别文档结构

先让模型判断文档类型和结构。

请先识别这份文档的类型和主要结构，不要开始总结。输出：
1. 文档类型
2. 主要章节或组成部分
3. 可能的关键字段
4. 需要特别核查的内容

对于判决书，结构通常包括：

案件基本信息。
当事人信息。
原告诉称。
被告辩称。
法院查明。
法院认为。
判决主文。
诉讼费用。

第二步：字段抽取

先抽取硬信息，减少后面总结出错。

字段包括：

案号。
法院。
裁判日期。
案由。
原告、被告、第三人。
诉讼请求。
关键金额。
关键日期。
判决主文。
履行期限。
费用承担。

第三步：分区总结

法律文书必须分清不同来源：

“原告诉称”是原告主张，不等于法院认定。
“被告辩称”是被告抗辩，不等于法院采信。
“法院查明”是法院认定事实。
“法院认为”是裁判理由。
“判决如下”是最终结果。

提示词里要明确禁止混同。

第四步：争议焦点归纳

争议焦点不是简单复述案情，而是双方真正争的法律或事实问题。

常见类型：

合同是否成立或有效。
是否履行主要义务。
是否违约或侵权。
损失金额如何认定。
责任由谁承担。
利息、违约金、费用是否支持。

第五步：输出前核查

总结后再让模型做核查：

判决主文是否逐项列出。
金额是否和原文一致。
日期是否和原文一致。
是否遗漏诉讼费。
是否把当事人主张写成法院认定。
是否出现原文没有的法律建议。

三、判决书专用高质量提示词

你是一名严谨的法律文书分析助手。请只基于我提供的民事判决书原文进行分析，不补充案外事实，不把任何一方主张直接当作法院认定，不提供正式法律意见。

# 工作流程
请按以下步骤处理：
1. 先识别文书结构。
2. 再抽取案号、法院、日期、案由、当事人、金额、诉讼请求、判决主文等硬信息。
3. 然后按“原告诉称、被告辩称、法院查明、法院认为、判决结果”分区总结。
4. 最后进行一致性核查，列出需要人工复核的问题。

# 重要规则
- 只基于原文。
- 原文未载明的信息写“原文未载明”。
- 金额、日期、案号、法院、当事人名称尽量按原文摘录。
- 如果存在多个请求、多个被告、多个法律关系或多项判决，必须分别列出。
- 不要把诉讼请求写成判决结果。
- 不要把被告抗辩写成法院认定。
- 不要把法院没有支持的请求写成已支持。
- 不要给出“必然胜诉/败诉”之类结论。

# 输出结构
一、文书结构识别

二、案件基本信息
- 案号：
- 审理法院：
- 裁判日期：
- 案由：
- 审理程序：
- 原告：
- 被告：
- 第三人：

三、关键字段抽取
- 关键金额：
- 关键日期：
- 涉及合同或法律关系：
- 诉讼费用：
- 履行期限：

四、原告诉称

五、被告辩称

六、法院查明事实
请按时间顺序列出。

七、争议焦点
请归纳 2-5 个真正争议点。

八、法院裁判理由
按争议焦点分别说明法院为何支持或不支持。

九、判决结果
逐项列出判决主文，包括支付义务、履行期限、驳回请求、费用承担。

十、一致性核查
请检查：
- 是否遗漏任一诉讼请求。
- 是否遗漏任一判决主文。
- 金额、日期、主体是否需要人工复核。
- 是否存在原文未载明但可能影响理解的信息。

十一、极简摘要
用 150 字以内概括：谁告谁、因为什么、法院怎么判。

<judgment>
在这里粘贴判决书全文
</judgment>

四、特别长的判决书怎么处理

如果文书超过模型一次能稳定处理的长度，使用分段法。

第一轮：分段抽取

你将收到判决书的第 [n] 段。请只处理本段，不要总结全文。

输出：
1. 本段属于文书哪个部分。
2. 本段出现的主体、日期、金额。
3. 本段关键事实。
4. 本段可能影响最终判决的内容。
5. 本段无法判断但需后续合并时注意的问题。

<segment index="[n]">
粘贴本段
</segment>

第二轮：合并总表

下面是各段抽取结果。请合并为一份总表。

要求：
1. 合并重复主体、日期、金额。
2. 标记段落之间的矛盾或需要复核处。
3. 不要新增各段中没有的信息。

<segment_notes>
粘贴各段抽取结果
</segment_notes>

第三轮：总总结

请基于合并后的总表和原始关键段落，生成最终结构化总结。若总表与原文关键段落冲突，以原文关键段落为准，并标注需要人工复核。

五、法律文书输出的风险控制

1. 不要直接问“我能不能赢”

这会诱导模型给出过度确定的法律判断。更好的问法：

请基于判决书原文，总结法院支持和不支持各项请求的理由，并列出可能影响上诉或执行的事实点。不要给出确定性胜败预测。

2. 要保留依据

如果用于复核，要求模型列出“原文依据摘要”。

每个关键结论后，请用一句话说明其原文依据来自哪一部分，例如“法院认为部分”“判决主文部分”。

3. 重要事项必须人工复核

这些内容不能只信模型：

上诉期限。
履行期限。
金额和利息计算。
判决主文。
执行风险。
是否需要申请再审、抗诉或另案起诉。

AI 可以做阅读辅助，不能替代律师或当事人的正式判断。

六、长文档总结的通用模板

你是一名严谨的长文档分析助手。请只基于输入文档完成总结。

# 任务
对文档进行结构化总结，并提取所有关键事实、数字、日期和风险点。

# 规则
1. 只基于原文，不补充外部事实。
2. 原文未载明写“原文未载明”。
3. 区分事实、观点、结论和建议。
4. 保留关键数字、日期、主体、条件。
5. 如果文档内部存在矛盾，请标注。
6. 输出前检查是否遗漏文档结尾处的决定、结论、费用、期限或附件说明。

# 输出
一、文档类型和结构
二、核心结论
三、关键事实表
四、时间线
五、主体关系
六、数字和金额汇总
七、风险点和待复核问题
八、200 字以内摘要

<document>
粘贴文档全文
</document>

七、常见误区

误区 1：直接让模型总结全文

如果文档长、结构复杂，直接总结容易遗漏。先抽取字段，再总结更稳。

误区 2：不区分来源

法律文书里最危险的错误是把“当事人说”写成“法院认定”。

误区 3：不要求保留硬信息

金额、日期、案号、履行期限、费用承担必须单独抽取。

误区 4：不设置拒答和不确定

原文没有的信息必须允许模型写“原文未载明”，否则模型可能补全。

八、理解检查

为什么法律文书总结要先抽取硬信息？
“原告诉称”和“法院查明”有什么区别？
判决书总结中最需要人工复核的五类信息是什么？
超长文档为什么要先分段抽取再合并？
为什么不建议直接问 AI“我能不能赢”？

九、练习

找一份你可以公开处理的判决书或合同，先不要让 AI 总结全文。按下面三步练习：

让 AI 识别文档结构。
让 AI 抽取关键字段。
再让 AI 做最终总结和一致性核查。

记录哪个阶段最容易出错，下次我们可以针对这个失败点继续改提示词。