企业AI Agent的真正难题:不是造出来,是管起来
Site Owner
发布于 2026-04-17
基础agent模式已成熟,真正的问题是让agent在真实商业数据、真实权限、真实后果下工作。三道坎:数据理解需要业务语境,权限需要动态继承,换模型不能重建系统。当agent从演示能力变成生产系统,真正的门槛是组织准备好为agent的行为背书了吗。
企业AI Agent的真正难题:不是造出来,是管起来
基础 agent 模式已经成熟了。模型加工具加推理加执行,这个循环人人会做。
真正的问题是:怎么让它在真实商业数据、真实权限、真实后果下工作?(来源:Databricks Agent Bricks 官方博客)
这是企业 AI Agent 落地和 demo 最大的差距。Demo 展示能力,企业需要的是治理。
三个真实挑战:数据、权限、跨模型
让 agent 在企业环境里工作,至少要过三道坎。
数据理解。 标准 RAG 可以检索文档,但 agent 需要理解业务数据的含义——为什么这笔订单金额是负数,这张报表里的"渠道"在你们公司指什么。模型看得到格式,看不到业务语境。Databricks 接入 Unity Catalog 元数据(schema 定义、业务口径、数据血缘、权限和质量信号)后,agent 准确率比标准 RAG 高 70%,多步骤工作流效率提升 30%。
权限追溯。 谁授权 agent 访问哪些数据?出了问题谁负责?很多平台的方案是给 agent 配一张"通行证"——但这张证是静态的,不能随用户身份动态调整。Agent Bricks 通过 on-behalf-of token passing 实现:agent 继承用户身份,只能访问该用户被授权访问的范围。无论查询 lakehouse 还是调用外部 API,权限和审计逻辑贯穿始终。
跨模型锁定。 今天用 Claude,明天换 GPT,后天想试试 Gemini——大多数平台换模型意味着重建系统。Databricks 数据显示,63% 的客户已经在同时路由两个以上的模型家族。这不是选型策略,是抗风险策略。
Databricks Agent Bricks 的解法
Databricks 聚集了四类客户——Workday(HR系统)、Virgin Atlantic(航空)、Zapier(工作流自动化)、AstraZeneca(制药)。解决的问题各不相同,但架构思路一致。
AI Gateway:统一模型访问层。 接入多个模型供应商和编码 agent(Cursor、Codex、Claude Code),通过单一 API 路由,支持 fallback 和成本优化。换模型不需要重建系统。Guardrails 模块同时检测 PII 泄露、提示注入、数据外泄和幻觉——这些风险在 agent 自主执行时会被放大。
Supervisor Agent:多 agent 编排。 定义任务,连接系统,Supervisor 协调跨模型和跨工具的执行。不是让一个 agent 做所有事,是让多个专业 agent 各司其职。
Unity Catalog:治理内嵌,不是事后打补丁。 数据、模型、外部 MCP 的访问权限在同一个系统里管理,身份端到端强制执行。Databricks 客户 Zapier 的工程师说:以前硬编码路由逻辑,现在用配置而非代码来引导 agent 的优先级和行为。
企业落地的真相:不是技术选型,是组织治理
IDC 的研究数据很残酷:43% 的企业认为现有架构是落地 AI 的主要障碍,95% 报告项目延期。(来源:IDC,为 MongoDB 委托研究)
不是模型不够强。是底层系统跟不上。
AstraZeneca 的案例值得细看。他们的 agent 负责供应链异常检测——当库存数据出现异常模式时,agent 自主判断是否触发补货流程。这个场景有几个特点:实时性要求高、决策后果严重、不能等到人类审批。agent 不是在"辅助决策",是在"做决策"。
Zapier 的做法则相反。他们的 agent 在人类监督下执行高风险操作——自动化工作流涉及外部系统权限时,必须有人的确认节点。
两种路径没有对错。区别在于:你对 agent 的容错边界在哪里,这个边界由谁定义。
给技术决策者的判断框架
上线 agent 之前,先问两个问题。
谁来负责? agent 的每一个操作,最终责任人是谁?不是模型提供商,不是工具供应商,是你的组织。这决定了你需要的治理深度,也决定了出了问题谁能拍板。
谁来审计和设置边界? agent 做了什么决策、访问了哪些数据、为什么选了这条路——这些必须有日志。同时,哪些操作需要 human-in-the-loop,哪些场景可以 autonomous decision——这个判断不能留给 agent 本身,得在系统设计阶段就定清楚。
Databricks 客户 EchoStar 有一句话说得很好:"我们不是在做一个 AI 项目,我们是在建一个企业 AI 结构体。互操作性、身份优先的安全和治理从第一天就设计进去了,让 agent 像其他关键系统一样运转,而不是一个科学实验。"
当 agent 从"演示能力"变成"生产系统",技术选型只是第一步。真正的门槛是:你的组织准备好为 agent 的行为背书了吗?
素材来源:
- Databricks Agent Bricks 官方博客:https://www.databricks.com/blog/agent-bricks-governed-enterprise-agent-platform
- MongoDB/IDC 研究(AI就绪度差距):https://www.mongodb.com/company/blog/innovation/new-research-reveals-overcoming-legacy-tech-issues-key-ai-success