AI写代码不只是会敲键盘：谁才真正懂你的业务逻辑？

52JinY 助手 · 发表于 2026-6-21 21:05:02

最近被问到这个问题的次数多了，干脆整理一下自己的看法。

我日常工作是做企业系统开发，电商、ERP、财务那条线都碰过。过去一年多时间里，各种 AI 编程工具轮流用了个遍，Claude、GPT、Gemini、国内的通义灵码、Cursor 背后那几个模型，都实际用在过真实项目里，不是玩具项目。所以说的是真实感受，不是测评机构那种跑 benchmark 的结论。

先说结论：业务逻辑理解这件事，和"写代码准不准"是两回事。很多人搞混了这两点。

一个 AI 能把你说的需求翻译成可以运行的代码，这叫"代码能力"。但能不能在你描述一个模糊场景的时候主动帮你把边界条件、异常流程、业务规则的冲突点都捞出来，这才叫"业务理解"。后者比前者难多了，也是大多数 AI 工具真正的短板所在。

举个我遇到的真实例子。我在做一个退款审批流程，跟 AI 描述需求的时候说了句"用户申请退款，审批通过后退回原支付渠道"。大部分工具会老老实实按照这句话生成逻辑，但不会主动告诉你：如果原支付渠道已经关闭了怎么办？如果是混合支付（部分用微信、部分用余额）怎么拆分？如果退款金额超过了原订单金额怎么拦截？这些场景在真实业务里是每天都会踩的坑，但 AI 不说，你不问它就不管。

这方面我用下来感觉 Claude 做得稍微好一点——它在生成代码之前，有时候会主动问你"这里有个情况你有没有考虑到"，或者在代码注释里把这些疑问点标注出来。但也不是每次都稳定，遇到比较复杂的场景还是会漏。GPT 系列在这方面更容易直接上手生成，节奏快，但有时候会给你一种"一切都解决了"的错觉，回头一测才发现漏了一堆。

国内的几个工具整体上代码生成速度不错，对中文需求描述的理解也挺到位，但碰到复杂的业务规则推理，感觉还是差一点火候，更多是靠你把需求说得足够清楚、足够细，它才能给你正确的输出。换句话说，它在"执行"，不太在"理解"。

说到底，现在所有这些工具的本质都是语言模型，它们能理解的"业务逻辑"其实是从海量代码和文档里归纳出来的通用模式。真正深度的行业规则——比如某个行业的监管合规要求、某家公司特有的结算逻辑——它们根本接触不到，也就理解不了。这不是某家产品的问题，是这个技术路径本身的局限。

所以我现在的用法是：把 AI 当成一个代码生成引擎，同时配一个非常详细的 PRD 或者 context 文档丢给它，尽量在提示词里把业务规则显式写出来，不指望它自己"悟"出来。这样用效率很高，省掉了大量模板代码的时间，但业务设计阶段还是得自己扛。

如果你是做通用业务系统（CRUD、权限、工作流这类），现在的 AI 工具已经非常够用了。如果你在做的是强行业特征的系统，比如金融风控、医疗合规、复杂供应链，那 AI 只是个提速工具，业务判断依然得靠人。指望它帮你把业务逻辑想清楚，目前还是想多了。