Почему прогресс ИИ неравномерен? Основатели a16z и Replit: проверяемость - это ключевое отличие

robot
Генерация тезисов в процессе

Известный венчурный капиталист a16z, основатель Марк Андриссен и основатель Replit Амджад Масад 25 октября провели разговор, сосредоточившись на текущем состоянии развития ИИ. Андриссен отметил, что достижения ИИ в написании кода, математике и моделировании физических явлений потрясающи, но в таких областях, как медицина и право, наблюдается стагнация. Масад ответил, что ключевым моментом является не сложность, а возможность верификации. То есть, задачи, которые можно объективно оценить на предмет правильности, развиваются быстрее, тогда как в более неопределенных областях прорыв добиться труднее.

У ИИ есть два типа скорости: тот, который может быть проверен, бегает быстрее всех.

Masad сначала обсудил методы обучения моделей. Ранние языковые модели просто смотрели на текст и затем угадывали следующее слово. Хотя они могли говорить, они не могли действительно рассуждать. Только после введения обучения с подкреплением (Reinforcement Learning, RL) ИИ начал учиться в верифицируемых условиях. Он объяснил:

«Например, такие задачи, как исправление ошибок в программировании, наличие юнит-тестов или возможность получения четких результатов, AI может сразу понять, прав он или нет.»

Этот способ тренировки с мгновенной обратной связью позволяет ИИ быстро улучшать свои способности к решению задач.

Почему медицина и юриспруденция не успевают?

Андриссен спросил: «А как насчет медицины и юриспруденции? Почему кажется, что прогресс там идет так медленно, и есть явления стагнации?» — ответил Масад:

«Потому что из-за них нет единственного ответа.»

Masad приводит пример: медицинская диагностика может иметь множество причин заболеваний и изменяться на разных этапах, а судебные решения могут различаться из-за различий в судьях и делах, что делает их слишком гибкими и не имеющими четких стандартных ответов. Это затрудняет самопроверку модели и не позволяет установить цикл усиления.

Хотя можно использовать усиленное обучение с обратной связью от человека (RLHF) для поддержки модели, это все же относится к субъективной оценке, и не так прямо и четко, как математика или программы.

( Примечание: обучение с подкреплением на основе человеческой обратной связи ( RLHF ) является одной из технологий машинного обучения ( ML ), использующей человеческую обратную связь для улучшения моделей ML, чтобы повысить эффективность самообучения. )

На самом деле ключевым моментом является не “сложность”, а “проверяемость”.

Андрессен, подводя итоги своих наблюдений, сказал: «Итак, суть не в том, насколько сложна проблема, а в том, можем ли мы подтвердить правильный ответ?» Масад отметил:

«Да, взрыв AI в программировании и математике произошел не потому, что это проще, а потому что можно проверить результаты.»

Например, при написании программы, как только программа может быть скомпилирована и тестирование проходит успешно, ИИ может немедленно получить обратную связь с “правильным ответом”, что позволяет модели автоматически выполнять тысячи тренировок каждый день и быстро эволюционировать.

В каких еще областях есть возможность верификации?

Два человека перечислили несколько областей, в которых ИИ развивается быстрее всего:

Математика и физика: есть четкие уравнения и результаты моделирования.

Химия и биология: такие как сворачивание белков, последовательности генов, могут быть проверены экспериментально или с помощью моделирования.

Робот: успех или неудача миссии могут быть непосредственно количественно оценены.

Эти области относятся к сфере, которая может быть объективно проверена, и поэтому они являются самым крутым наклоном кривой обучения для ИИ на данный момент.

Искусственный интеллект, пишущий программы, сначала взлетит на высоту, а медицина и право все еще в пути.

Masad сказал в своем резюме:

«Искусственный интеллект, пишущий программы, сначала взлетит, затем за ним последуют математика, физика и химия. Но такие более абстрактные области, как медицина и право, будут развиваться медленно.»

Андриссен тоже согласен:

«Это естественное явление. ИИ сначала взрывается там, где можно количественно оценить, а в областях человеческого суждения он будет немного отставать.»

Почему в AI наблюдается неравномерный прогресс? Основатели a16z и Replit: проверяемость является ключевым отличием. Впервые опубликовано в Chain News ABMedia.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить