技术洞察2026-03-20· 8 分钟阅读

AI 编程的两个结构性缺陷

AI 编程工具普及后，一个反直觉的问题出现了：模型越强，某些类型的错误反而越严重。本文分析 AI 编程的两个根本性缺陷，以及为什么这两个问题会随模型能力提升而恶化。

在把 AI 引入日常开发工作流近两年后，我们发现了一个反直觉的规律：模型能力提升，某些类型的错误不降反升。

这不是某个模型的问题，而是当前所有 AI 编程工具共有的结构性缺陷。我们把它归纳为两个：

缺陷一：上下文不足

AI 模型在处理代码时，看到的永远是片段，而不是系统。它能读懂你粘进去的那几个文件，但它看不到：

结果是幻觉——不是模型乱说，而是模型在信息不完整的情况下做出了局部合理但系统错误的决策。它写出的代码技术上是正确的，但违反了你的架构意图。

更糟的是：模型越自信，这个问题越严重。GPT-4 比 GPT-3.5 更流畅地写出"看起来合理但实际上破坏了依赖关系"的代码。强模型 + 差上下文 = 以机器速度生产技术债。

给 AI 一个需求，它会立刻开始写代码。这听起来很高效，但实际上跳过了软件开发中最重要的几步：

没有这些步骤，你得到的是失控：需求范围悄悄扩大，没有测试，上线后静默回归（功能 A 的修改悄悄破坏了功能 B，没有任何报错）。

这两个缺陷在三个层面产生了可预测的失败模式：

层面	失败模式
架构层	不必要的抽象层、过度模块化、过早泛化、事件系统过度设计、配置系统过度设计
模块层	单模块功能膨胀、职责不清、跨模块重复逻辑、耦合过重、接口不稳定
代码层	死代码残留、循环依赖、函数拆得过碎、内聚度低、测试覆盖空洞、文档与实现脱节

这 19 种失败模式都不是随机的，它们都有同一个根源：模型在没有完整信息的情况下做了不可逆的结构决策。

当模型能力弱时，开发者不会完全依赖它——你会验证、会质疑、会自己检查。

当模型能力强时，开发者倾向于直接采纳输出。GPT-4o 或 Claude 3.7 Sonnet 写出来的代码，90% 的情况下语法完美、逻辑流畅，你不会逐行检查。但这正是问题所在：它的输出质量足够高，让你忽略了结构层面的错误。

有一个比喻：弱模型像一个慢但诚实的初级工程师，你知道要检查他的工作。强模型像一个快速自信的高级工程师，你倾向于信任他——但这个"高级工程师"对你的系统历史一无所知，每次对话都是第一天上班。

针对这两个缺陷，解法方向很明确：

这是我们构建 Manon 的出发点，也是我们交付软件开发服务的底层方法论。后续文章我们会详细介绍知识图谱的工作原理和我们的开发流程。

我们把这套方法论用在每一个客户项目上。欢迎聊聊你的具体需求。