什么是高质量的AI复盘分析
不管是对于个人还是组织,复盘都是一个十分有效的系统调优行动。
一个标准的复盘通常遵循四个基本步骤:原定目标是什么?实际发生了什么?差异原因是什么?下次如何改进?
这是高效复盘的基本原则。可以看出,这个原则要求复盘的前提得有一个目标,复盘相当于一个“目标对齐”的回顾过程。
但从现实来看,不管是组织还是个人,很多目标在一开始是不清晰的,甚至是隐式的。虽然目标模糊,但我们依然可以凭直觉识别出什么是好、什么是坏,哪里混乱、哪里出了问题。因此,在现实中,复盘衍生出了许多变体,例如复盘好的行为,坏的行为,改进点。
这种复盘依然极具价值,因为它能在复盘的过程中逐渐将原始目标变得清晰和显性化。
对于我个人而言,我几乎每天都会进行复盘。久而久之,总结出了一套极简的复盘思路,主要包含三块内容:Did / Bad / Thinking。
Did:我今天做了什么(单纯的事实记录)。
Bad:我觉得做得不够好的地方(识别坏习惯)。
Thinking:我脑子里出现的任何念头(即使是没成形的思考)。
这种个人复盘本质上是跳出自我,像旁观者一样监控自己的认知过程。这就像给认知照镜子,久而久之,你自然会不断进行自我确认,从而让自己的喜好、价值观、目标以及优缺点变得越来越清晰。
AI 时代的复盘与困境
有了 AI 之后,我每天做的事情就是将复盘内容复制给 AI 进行分析。我最常用的是 ChatGPT。我发现即使不需要补充任何前置提示词,AI 也可以接住我的情绪,对我的复盘内容进行本质分析,给出可行性意见。
为了固化这个流程,我创建了一个 GPT叫做“反思助手”,提示词很简单:
“我会给出一段反思内容,请你扮演我的人生导师,先分析问题的本质,然后针对我的实际情况,给出建议。”
一般大模型产品都有记忆功能,如果长期使用一个 AI,它会保存你的记忆,提供更加个性化的高质量分析反馈。
但当我想把这套方法论分享给更多人时,我发现很多人其实不用 ChatGPT,而是喜欢用其他大模型产品,比如DeepSeek,豆包。由于不同模型内置的 System Prompt 不同,导致得到的 AI 分析复盘质量参差不齐。
比如下面这张图是用 Gemini Flash 2.5 模型调用 API,并加上“反思助手”提示词后生成的结果:
可以发现这个 AI 分析的问题在于,虽然看起来非常“深层次”,会从心理学角度讲本质(比如大脑的认知疲劳、自我调节机制不足等),但实际上非常缺乏个性化。
如果你是第一次读,可能会觉得它在通过严肃的心理学知识剖析短视频上瘾的机制,你有了得到了知识的快感;但读第二次时,你就会发现这种分析没有任何行动指向。
这些方案虽然涉及本质,但只是非常通用的解决方案。对于我自己来讲,我当然知道刷短视频太多会影响休息,这是一个坏习惯,但我还是改不掉,为什么呢?我希望高质量的AI分析可以跨越通用建议,给出解决个体深层次的本质分析和行动建议。
定义“高质量”
所以,真正高质量的 AI 复盘分析,必须具备以下特点:
痛点挖掘:给出一个可以瞬间改变你认知的、对你认知有影响、有碰撞的点。
行动导向:给出的建议必须是你当下就可以去执行的。
这两个特点只是我一开始非常浅的想法,我还需要进一步分析,给出一个相对严谨的答案,这就是这篇文章想要讨论的事情:如何定义高质量的 AI 复盘分析?
如果有了这个定义,那么使用任何一个大模型,都可以得到相对高质量的复盘分析回复,整套方法论就可以迁移。
思考问题,得到一个答案的方法有两种:
推理:给出几种可能的假设。这些假设可以依靠你的经验或者已有知识来推断,或者基于观察、模式识别和总结能力来进行推断,得到一个准确答案的过程如下:用假设进行实验验证;如果验证结果不对,再去寻找问题并分析原因;根据分析结果进行调整。通过这种不断循环的方式,最终得到一个相对准确的答案。
问一下 AI:有了 AI 工具之后,很多情况下问题不需要我们自己想,直接去问 AI 即可。AI 相当于是一个万事通,它可以回答你任何问题,至于答案的质量则是需要你来评估的。
所以通过这两种方法,我最终得出的一个“什么是高质量 AI 复盘分析”的定义是这样的。
- 情绪接住 (Emotional Validation):让用户感到“被理解”而非“被审视”。(态度层)
- 模式识别 (Micro-Pattern Recognition):识别出关键词和重复行为。(事实层)
- 概率性归因 (Probabilistic Attribution):基于特定领域的“第一性原理”或“最佳实践模型”。(深度层)
- 微干预建议 (Intervention):低阻力(容易做) + 高精准度(针对归因)。不是“宏大的长期建议”,而是“当下就能做的最小动作”或“环境调整策略”。(行动层)
结合我自己的每日复盘模板:Done、Bad、Thinking。其中 Thinking 又可以进一步拆分为四个层级:客观事实、情绪感受、洞察领悟、具体行动。在上述通用定义的基础上,我意识到还需要一层微观质量控制:
不同类型的复盘内容,对“高质量分析”的要求是不同的。
因此,每一个模块、每一个层级,都应该有各自独立的高质量判定标准,因此,就得到了一套微观质量定义矩阵。
下面是用豆包分析的复盘内容对比:第一张图是豆包直接分析的,没有任何提示;第二张图是用了高质量复盘分析定义约束的返回结果。
你们觉得哪种效果更好呢?