返回

长文档与法律文书提示词.md

8.5 KB · MD · 2026-06-14 10:30

案例:长文档与法律文书提示词

日期:2026-06-10

本文件是场景案例,不是主线第三讲。建议先学习 ../../核心课程/01-现代提示词工程总论.md../../核心课程/02-从提示词到上下文工程.md,再用本案例练习“先抽取、再总结、再核查”的长文档流程。

一、直觉

长文档总结最怕两件事:

  1. 模型只看开头和结尾,漏掉中间关键内容。
  2. 模型把“原文写了什么”和“自己推断了什么”混在一起。

法律文书更严格,因为金额、日期、主体、诉讼请求和判决主文不能错。成熟做法不是直接让模型“总结”,而是分三步:

抽取事实 -> 归纳结构 -> 核查风险

二、长文档处理流程

第一步:识别文档结构

先让模型判断文档类型和结构。

请先识别这份文档的类型和主要结构,不要开始总结。输出:
1. 文档类型
2. 主要章节或组成部分
3. 可能的关键字段
4. 需要特别核查的内容

对于判决书,结构通常包括:

  • 案件基本信息。
  • 当事人信息。
  • 原告诉称。
  • 被告辩称。
  • 法院查明。
  • 法院认为。
  • 判决主文。
  • 诉讼费用。

第二步:字段抽取

先抽取硬信息,减少后面总结出错。

字段包括:

  • 案号。
  • 法院。
  • 裁判日期。
  • 案由。
  • 原告、被告、第三人。
  • 诉讼请求。
  • 关键金额。
  • 关键日期。
  • 判决主文。
  • 履行期限。
  • 费用承担。

第三步:分区总结

法律文书必须分清不同来源:

  • “原告诉称”是原告主张,不等于法院认定。
  • “被告辩称”是被告抗辩,不等于法院采信。
  • “法院查明”是法院认定事实。
  • “法院认为”是裁判理由。
  • “判决如下”是最终结果。

提示词里要明确禁止混同。

第四步:争议焦点归纳

争议焦点不是简单复述案情,而是双方真正争的法律或事实问题。

常见类型:

  • 合同是否成立或有效。
  • 是否履行主要义务。
  • 是否违约或侵权。
  • 损失金额如何认定。
  • 责任由谁承担。
  • 利息、违约金、费用是否支持。

第五步:输出前核查

总结后再让模型做核查:

  • 判决主文是否逐项列出。
  • 金额是否和原文一致。
  • 日期是否和原文一致。
  • 是否遗漏诉讼费。
  • 是否把当事人主张写成法院认定。
  • 是否出现原文没有的法律建议。

三、判决书专用高质量提示词

你是一名严谨的法律文书分析助手。请只基于我提供的民事判决书原文进行分析,不补充案外事实,不把任何一方主张直接当作法院认定,不提供正式法律意见。

# 工作流程
请按以下步骤处理:
1. 先识别文书结构。
2. 再抽取案号、法院、日期、案由、当事人、金额、诉讼请求、判决主文等硬信息。
3. 然后按“原告诉称、被告辩称、法院查明、法院认为、判决结果”分区总结。
4. 最后进行一致性核查,列出需要人工复核的问题。

# 重要规则
- 只基于原文。
- 原文未载明的信息写“原文未载明”。
- 金额、日期、案号、法院、当事人名称尽量按原文摘录。
- 如果存在多个请求、多个被告、多个法律关系或多项判决,必须分别列出。
- 不要把诉讼请求写成判决结果。
- 不要把被告抗辩写成法院认定。
- 不要把法院没有支持的请求写成已支持。
- 不要给出“必然胜诉/败诉”之类结论。

# 输出结构
一、文书结构识别

二、案件基本信息
- 案号:
- 审理法院:
- 裁判日期:
- 案由:
- 审理程序:
- 原告:
- 被告:
- 第三人:

三、关键字段抽取
- 关键金额:
- 关键日期:
- 涉及合同或法律关系:
- 诉讼费用:
- 履行期限:

四、原告诉称

五、被告辩称

六、法院查明事实
请按时间顺序列出。

七、争议焦点
请归纳 2-5 个真正争议点。

八、法院裁判理由
按争议焦点分别说明法院为何支持或不支持。

九、判决结果
逐项列出判决主文,包括支付义务、履行期限、驳回请求、费用承担。

十、一致性核查
请检查:
- 是否遗漏任一诉讼请求。
- 是否遗漏任一判决主文。
- 金额、日期、主体是否需要人工复核。
- 是否存在原文未载明但可能影响理解的信息。

十一、极简摘要
用 150 字以内概括:谁告谁、因为什么、法院怎么判。

<judgment>
在这里粘贴判决书全文
</judgment>

四、特别长的判决书怎么处理

如果文书超过模型一次能稳定处理的长度,使用分段法。

第一轮:分段抽取

你将收到判决书的第 [n] 段。请只处理本段,不要总结全文。

输出:
1. 本段属于文书哪个部分。
2. 本段出现的主体、日期、金额。
3. 本段关键事实。
4. 本段可能影响最终判决的内容。
5. 本段无法判断但需后续合并时注意的问题。

<segment index="[n]">
粘贴本段
</segment>

第二轮:合并总表

下面是各段抽取结果。请合并为一份总表。

要求:
1. 合并重复主体、日期、金额。
2. 标记段落之间的矛盾或需要复核处。
3. 不要新增各段中没有的信息。

<segment_notes>
粘贴各段抽取结果
</segment_notes>

第三轮:总总结

请基于合并后的总表和原始关键段落,生成最终结构化总结。若总表与原文关键段落冲突,以原文关键段落为准,并标注需要人工复核。

五、法律文书输出的风险控制

1. 不要直接问“我能不能赢”

这会诱导模型给出过度确定的法律判断。更好的问法:

请基于判决书原文,总结法院支持和不支持各项请求的理由,并列出可能影响上诉或执行的事实点。不要给出确定性胜败预测。

2. 要保留依据

如果用于复核,要求模型列出“原文依据摘要”。

每个关键结论后,请用一句话说明其原文依据来自哪一部分,例如“法院认为部分”“判决主文部分”。

3. 重要事项必须人工复核

这些内容不能只信模型:

  • 上诉期限。
  • 履行期限。
  • 金额和利息计算。
  • 判决主文。
  • 执行风险。
  • 是否需要申请再审、抗诉或另案起诉。

AI 可以做阅读辅助,不能替代律师或当事人的正式判断。

六、长文档总结的通用模板

你是一名严谨的长文档分析助手。请只基于输入文档完成总结。

# 任务
对文档进行结构化总结,并提取所有关键事实、数字、日期和风险点。

# 规则
1. 只基于原文,不补充外部事实。
2. 原文未载明写“原文未载明”。
3. 区分事实、观点、结论和建议。
4. 保留关键数字、日期、主体、条件。
5. 如果文档内部存在矛盾,请标注。
6. 输出前检查是否遗漏文档结尾处的决定、结论、费用、期限或附件说明。

# 输出
一、文档类型和结构
二、核心结论
三、关键事实表
四、时间线
五、主体关系
六、数字和金额汇总
七、风险点和待复核问题
八、200 字以内摘要

<document>
粘贴文档全文
</document>

七、常见误区

误区 1:直接让模型总结全文

如果文档长、结构复杂,直接总结容易遗漏。先抽取字段,再总结更稳。

误区 2:不区分来源

法律文书里最危险的错误是把“当事人说”写成“法院认定”。

误区 3:不要求保留硬信息

金额、日期、案号、履行期限、费用承担必须单独抽取。

误区 4:不设置拒答和不确定

原文没有的信息必须允许模型写“原文未载明”,否则模型可能补全。

八、理解检查

  1. 为什么法律文书总结要先抽取硬信息?
  2. “原告诉称”和“法院查明”有什么区别?
  3. 判决书总结中最需要人工复核的五类信息是什么?
  4. 超长文档为什么要先分段抽取再合并?
  5. 为什么不建议直接问 AI“我能不能赢”?

九、练习

找一份你可以公开处理的判决书或合同,先不要让 AI 总结全文。按下面三步练习:

  1. 让 AI 识别文档结构。
  2. 让 AI 抽取关键字段。
  3. 再让 AI 做最终总结和一致性核查。

记录哪个阶段最容易出错,下次我们可以针对这个失败点继续改提示词。