Skip to content

Self-reflection 的幻觉:为什么让模型“反思”往往没用? | Luhui's Personal Website #111

@LDingLDing

Description

@LDingLDing

https://blog.liluhui.cn/2025/12/24/The-Illusion-of-Self-Reflection/

如果你对 Agent 可信性、模型行为、安全边界、长期对齐问题 感兴趣,欢迎关注 @luhuidev。 我会在全平台持续更新这个系列,把论文、实验、工程直觉,慢慢拆给你看。 前言我们这一年在工程里最常见的一个动作是: 模型答错了?让它反思一下。 加一句 “Let’s reflect” “Check your answer” “Are you sure?”,或者做个 “draft → cr

Metadata

Metadata

Assignees

No one assigned

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions