最近看到一份关于AI Agent工程应用的市场调查数据,挺有意思的,分享一下核心发现。



从实际应用来看,客服确实成了最吃香的场景,占比26.5%,其次是研究和数据分析(24.4%),再然后才是内部协作和生产力工具(17.7%),代码生成只排到第四位,仅占9.8%。这跟不少人的预期可能不太一样。

但要说最大的绊脚石,还是质量问题。32%的从业者把它列为首要障碍,涵盖准确性、相关性、一致性等多个维度——这点跟去年的痛点是一致的。反倒是成本焦虑,今年明显没那么突出了。

有意思的是,89%的公司都给自家的Agent装上了某种可观测性工具,其中62%还做到了比较细粒度的追踪。这说明大家都认识到了追踪多步骤推理和工具调用能力的重要性,已经不是可选项了。

在模型选择上,虽然OpenAI的模型使用率超过三分之二,但多模型组合才是主流——超过75%的组织同时跑着多个不同的模型。不过有意思的是,三分之一的组织还在投资自建模型基础设施,说明API便利性之外,本地部署对企业还是很有吸引力。

关于微调,这块还是比较小众的。57%的组织压根不做微调,反而是用基础模型配合提示优化和RAG(检索增强生成)就能搞定大多数需求。

这份数据的样本主要来自B端企业用户,基本能反映当下的实际情况。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 4
  • 转发
  • 分享
评论
0/400
无聊饭团vip
· 16小时前
客服场景吃香这事儿其实早就该预见了,毕竟降本增效才是王道,代码生成才占9.8%我倒是有点意外...质量问题还是老大难,看来LLM的"幻觉"病还得继续治 多模型混用已经成标配了?那这样的话单押OpenAI的企业得开始慌了 不过自建基础设施的这三分之一是真的有钱,还是说国内厂商终于有竞争力了 RAG配提示词就能打都想微调的人,看来微调的投入回报率确实一般般 Agent的可观测性工具用率这么高,是真的还是大家互相抄数据... 57%不做微调说明直接甩基础模型才是最优解,省事儿 这数据是不是有点水分啊,感觉太"理想化"了
回复0
永远买顶的男人vip
· 16小时前
客服占比最高?害,还是得靠RAG+提示词啊,微调那条路感觉越来越鸡肋了 质量问题卡脖子一年没解决,这才是真的痛点,成本反倒不是事儿了 89%都装可观测性工具,看来大家心里都清楚——黑盒Agent谁都玩不转 OpenAI三分之二的使用率,但我看多模型组合才是王道,反正一个模型指定出问题 本地部署还有人投,API方便是假的,数据安全才是真需求
回复0
鱿鱼丝加班狗vip
· 17小时前
等等,代码生成才占9.8%?我一直以为这才是主菜啊,看来我太天真了哈哈 客服26.5%这么高我是没想到的,感觉就是把人从地狱里救出来了 质量问题永远是老大难,这俩年好像还没真正解决过,RAG和提示优化顶个啥用 话说75%都在玩多模型组合,那OpenAI不就成了标配?感觉都一样啊 89%装可观测性工具,这数字真的假的,我们这边根本没这概念
回复0
Liquidity_Huntervip
· 17小时前
客服26.5%?说明大家还是在用Agent做最没技术含量的活儿啊 质量问题永远是第一大坑,不过OpenAI被套了这么死,其他模型真的没机会吗 RAG+提示词就够用了,微调这块确实有点被过度吹嘘 89%都装可观测性工具?这已经变成标配了属于是 自建模型的那三分之一是真的有料还是就想反向绑定供应商啊 多模型才是主流这个我同意,单一依赖谁都不敢赌
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)