Self-reflection 的幻觉：为什么让模型“反思”往往没用？ | Luhui's Personal Website

https://blog.liluhui.cn/2025/12/24/The-Illusion-of-Self-Reflection/ 

 如果你对 Agent 可信性、模型行为、安全边界、长期对齐问题 感兴趣，欢迎关注 @LuhuiDev。 我会在全平台持续更新这个系列，把论文、实验、工程直觉，慢慢拆给你看。      前言我们这一年在工程里最常见的一个动作是： 模型答错了？让它反思一下。 加一句 “Let’s reflect” “Check your answer” “Are you sure?”，或者做个 “draft → cr