Недавно я наткнулся на рыночные исследования по применению AI-агентов в инженерной сфере — довольно интересно, делюсь основными выводами.
С точки зрения практического применения, обслуживание клиентов действительно стало самым популярным сценарием, занимая 26.5%, далее идут исследования и анализ данных (24.4%), затем внутреннее сотрудничество и инструменты повышения производительности (17.7%), а генерация кода занимает лишь четвертое место — всего 9.8%. Это может отличаться от ожиданий многих.
Но самой большой преградой остаются проблемы с качеством. 32% специалистов называют это основной барьером, охватывая такие аспекты, как точность, релевантность, согласованность и другие — это совпадает с проблемами прошлого года. А вот тревога по поводу стоимости в этом году явно снизилась.
Интересно, что 89% компаний установили у своих агентов какие-либо инструменты наблюдаемости, из них 62% реализовали достаточно детальное отслеживание. Это говорит о том, что все осознали важность отслеживания многошаговых рассуждений и вызовов при вызове инструментов — это уже не опция, а необходимость.
Что касается выбора моделей, хотя использование моделей OpenAI превышает две трети, большинство организаций используют мульти-модельные подходы — более 75% одновременно работают с несколькими разными моделями. Интересно, что треть организаций инвестирует в собственную инфраструктуру для моделей, что показывает привлекательность локальной развертки помимо удобства API.
Что касается дообучения, эта тема пока что менее популярна. 57% организаций вообще не занимаются дообучением, предпочитая использовать базовые модели с подсказками и RAG (Retrieval-Augmented Generation), чтобы удовлетворить большинство требований.
Данные в основном получены от B2B-компаний и в целом отражают текущую ситуацию.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
18 Лайков
Награда
18
4
Репост
Поделиться
комментарий
0/400
BoredRiceBall
· 13ч назад
Клиентский сценарий действительно давно должен был стать популярным, ведь снижение затрат и повышение эффективности — это главное, а генерация кода составляет всего 9.8%, что меня немного удивило... Проблемы с качеством по-прежнему остаются сложной задачей, похоже, болезнь "галлюцинаций" LLM еще требует лечения.
Использование нескольких моделей уже стало стандартом? Тогда компании, полагающиеся только на OpenAI, должны начать паниковать.
Однако треть тех, кто строит собственную инфраструктуру, действительно богат, или же отечественные производители наконец-то обрели конкурентоспособность.
Люди, которые хотят просто подстроить RAG с подсказками, кажется, считают, что инвестиции в тонкую настройку окупаются не очень хорошо.
Высокий уровень использования инструментов наблюдения за агентами — это действительно так или все просто копируют друг у друга данные...
57% отказа от тонкой настройки говорит о том, что прямое использование базовой модели — это лучший вариант, проще простого.
Эти данные, наверное, немного преувеличены, кажется, они слишком "идеализированы".
Посмотреть ОригиналОтветить0
TopBuyerForever
· 13ч назад
客服占比最高?害,还是得靠RAG+提示词啊,微调那条路感觉越来越鸡肋了
质量问题卡脖子一年没解决,这才是真的痛点,成本反倒不是事儿了
89%都装可观测性工具,看来大家心里都清楚——黑盒Agent谁都玩不转
OpenAI三分之二的使用率,但我看多模型组合才是王道,反正一个模型指定出问题
Локальное развертывание еще кто-то поддерживает, API удобен — это ложь, безопасность данных — настоящая необходимость
Посмотреть ОригиналОтветить0
OvertimeSquid
· 13ч назад
Подождите, только 9.8% на генерацию кода? Я всегда думал, что это основное, видимо, я был слишком наивен, ха-ха
Клиентская поддержка 26.5%, такой высокий показатель, я не ожидал, кажется, это как будто спасли человека из ада
Проблемы с качеством всегда остаются самой сложной задачей, за последние пару лет кажется, что их так и не решили, RAG и оптимизация подсказок — что они вообще дают
Кстати, 75% используют мульти-модельные комбинации, значит, OpenAI становится стандартом? Кажется, все одинаково
89% — это показатели инструментов для наблюдаемости, правда ли эти цифры, у нас вообще нет такого понятия
Посмотреть ОригиналОтветить0
LiquidityHunter
· 13ч назад
Обслуживание клиентов 26,5%? Это показывает, что все всё ещё используют Agent для выполнения наименее технической работы
Проблемы с качеством всегда на первом месте, но OpenAI настолько мёртв, что у других моделей вообще нет шансов?
Подсказки RAG+ достаточно, а тонкая настройка этого произведения действительно немного чрезмерно хвастается
89% оснащены инструментами наблюдаемости? Это стало стандартом и относится к Yes
Треть самодельной модели действительно материал, или вы хотите сделать обратное переплетывание поставщика?
Согласен, что несколько моделей — это мейнстрим, и никто не осмеливается ставить на одну зависимость
Недавно я наткнулся на рыночные исследования по применению AI-агентов в инженерной сфере — довольно интересно, делюсь основными выводами.
С точки зрения практического применения, обслуживание клиентов действительно стало самым популярным сценарием, занимая 26.5%, далее идут исследования и анализ данных (24.4%), затем внутреннее сотрудничество и инструменты повышения производительности (17.7%), а генерация кода занимает лишь четвертое место — всего 9.8%. Это может отличаться от ожиданий многих.
Но самой большой преградой остаются проблемы с качеством. 32% специалистов называют это основной барьером, охватывая такие аспекты, как точность, релевантность, согласованность и другие — это совпадает с проблемами прошлого года. А вот тревога по поводу стоимости в этом году явно снизилась.
Интересно, что 89% компаний установили у своих агентов какие-либо инструменты наблюдаемости, из них 62% реализовали достаточно детальное отслеживание. Это говорит о том, что все осознали важность отслеживания многошаговых рассуждений и вызовов при вызове инструментов — это уже не опция, а необходимость.
Что касается выбора моделей, хотя использование моделей OpenAI превышает две трети, большинство организаций используют мульти-модельные подходы — более 75% одновременно работают с несколькими разными моделями. Интересно, что треть организаций инвестирует в собственную инфраструктуру для моделей, что показывает привлекательность локальной развертки помимо удобства API.
Что касается дообучения, эта тема пока что менее популярна. 57% организаций вообще не занимаются дообучением, предпочитая использовать базовые модели с подсказками и RAG (Retrieval-Augmented Generation), чтобы удовлетворить большинство требований.
Данные в основном получены от B2B-компаний и в целом отражают текущую ситуацию.