https://blog.liluhui.cn/2025/12/24/The-Illusion-of-Self-Reflection/
如果你对 Agent 可信性、模型行为、安全边界、长期对齐问题 感兴趣,欢迎关注 @luhuidev。 我会在全平台持续更新这个系列,把论文、实验、工程直觉,慢慢拆给你看。 前言我们这一年在工程里最常见的一个动作是: 模型答错了?让它反思一下。 加一句 “Let’s reflect” “Check your answer” “Are you sure?”,或者做个 “draft → cr