Gensyn Тестовая сеть онлайн, как сделать обучение ИИ более эффективным и более Децентрализованным?

Gensyn Тестовая сеть запущена, как сделать обучение ИИ более эффективным и более децентрализованным?

AI является одним из самых обсуждаемых сегментов криптоиндустрии. Проект Gensyn, распределенная AI вычислительная сеть, в которую инвестировала a16z с общим объемом финансирования в 50 миллионов долларов, безусловно, является конкурентоспособным проектом. На днях Gensyn официально запустил Тестовая сеть, хотя это произошло на год позже изначального плана, но с запуском тестовой сети он наконец-то вступает в новую стадию.

Как специализированный на машинном обучении кастомизированный Ethereum Rollup, тестовая сеть Gensyn интегрировала оффлайн-исполнение, верификацию и коммуникационную инфраструктуру, с целью предоставления децентрализованным AI системам ключевых функций, таких как постоянная идентичность, отслеживание участия, поддержание прав собственности, платежи, координация удаленного выполнения, бездоверительная верификация, запись процесса обучения и краудфандинг масштабных задач обучения.

Первый этап Тестовой сети сосредоточен на отслеживании участия в RL Swarm. RL Swarm — это приложение для послетренировочного обучения с использованием совместного усиленного обучения, чьи узлы могут быть связаны с идентичностью на блокчейне, что обеспечивает точное фиксирование вклада каждого участвующего узла.

RL Swarm: основные функции и совместное обучение

В тестовой сети Gensyn основное приложение RL Swarm является системой совместного обучения моделей, построенной на основе децентрализованной сети. В отличие от традиционного независимого обучения единственной модели, RL Swarm позволяет нескольким моделям взаимодействовать, критиковать и улучшать друг друга в сети, тем самым совместно повышая общую производительность. Его основная идея заключается в "коллективном интеллекте", то есть через сотрудничество и обратную связь между моделями узлов достигается более эффективный результат обучения.

Можно просто понять, что модели, такие как DeepSeek-R1, во время обучения с использованием вывода могут улучшать свои результаты благодаря самокритике, в то время как RL Swarm расширяет этот механизм на множество моделей, достигая эффекта «много людей — много дров».

На основе системы RL Swarm модель не только зависит от собственного обратного связи, но и через наблюдение и оценку работы других моделей выявляет свои недостатки и оптимизирует их. Каждая модель-узел, присоединившаяся к Swarm, участвует в трехступенчатом процессе: сначала самостоятельно решает задачу и выдает идеи и ответы, затем смотрит ответы других узлов и предоставляет обратную связь, и в конечном итоге модель голосует за наилучшее решение и на его основе корректирует свои выводы. Этот координационный механизм не только повышает эффективность каждой модели, но и способствует эволюции всей группы моделей. Модели, присоединившиеся к Swarm, могут сохранять улучшенные локальные веса после выхода, получая реальную выгоду.

Gensyn Тестовая сеть запущена, как сделать обучение ИИ более эффективным и более Децентрализованным?

Кроме того, Gensyn открыла исходный код RL Swarm, и любой может запустить узел, начать или присоединиться к существующему Swarm без разрешения. Основная связь Swarm использует протокол шепота, предоставленный Hivemind, поддерживающий децентрализованную передачу сообщений и обмен сигналами обучения между моделями. Участвовать в совместном обучении можно как с помощью домашнего ноутбука, так и через узлы RL Swarm на облачном GPU.

Инфраструктура три основных столпа: исполнение, связь и валидация

На данный момент RL Swarm все еще является экспериментальной демонстрацией, которая показывает масштабируемый метод машинного обучения, а не конечную форму продукта. За последние четыре года основная работа Gensyn на самом деле заключалась в создании базовой инфраструктуры, которая перешла в стадию v0.1 после выпуска Тестовой сети и теперь может фактически функционировать. Согласно официальному описанию, общая архитектура Gensyn делится на три части: исполнение, связь и верификация.

Выполнение (Execution): согласованность и распределенная вычислительная мощность

Gensyn считает, что будущее машинного обучения больше не будет ограничено традиционными монолитными моделями, а будет состоять из фрагментированных параметров, распределенных по устройствам по всему миру. Для достижения этой цели команда Gensyn разработала базовую архитектуру выполнения, которая обеспечивает согласованность между устройствами. Ключевые технологии включают:

  • Распределенное параметрическое хранение и обучение: посредством разделения крупномасштабной модели на несколько параметрических блоков и распределения их по различным устройствам, Gensyn реализует фрагментарное развертывание модели, снижая требования к памяти для одного узла.
  • Постобучение с использованием усиленного обучения (RL Post-Training): Исследования показывают, что когда модель обучается совместно в группе, общаясь и критикуя ответы друг друга, общая эффективность обучения значительно возрастает. Gensyn продемонстрировал эту концепцию с помощью RL Swarm, позволяя моделям быстро прогрессировать в коллективных дискуссиях, что further подтвердило эффективность распределенного исполнения.
  • 可复现算子(RepOps):为了确保不同硬件(如 Nvidia A100 与 H100)能够得出完全一致的计算结果,Gensyn 开发了 RepOps 库,通过 фиксированное выполнение порядка операций с плавающей запятой, реализовано побитное воспроизведение на разных платформах.

Связь (Communication): эффективный обмен информацией

В сценариях массового распределенного обучения эффективная связь между узлами имеет решающее значение. Традиционные методы параллельной обработки данных, хотя и могут в определенной степени снизить затраты на связь, но из-за требования к каждому узлу хранить полную модель их масштабируемость ограничена памятью. В связи с этим Gensyn предложил совершенно новое решение:

  • SkipPipe – Динамическая параллельная система прыжков по трубам: Технология SkipPipe динамически выбирает вычислительные слои, через которые проходят микропакеты (microbatch), пропуская некоторые этапы традиционного конвейера, тем самым снижая ненужное время ожидания. Ее инновационный алгоритм планирования может в реальном времени оценивать доступность каждого пути, что снижает время простоя узлов и значительно сокращает общее время тренировки. По данным тестирования, в условиях Децентрализации, SkipPipe может сократить время тренировки примерно на 55%, а в случае частичных сбоев узлов производительность модели снижается всего на 7%.
  • Стандарты связи и межузловое сотрудничество Gensyn разработал протокол связи, аналогичный TCP/IP, который позволяет участникам по всему миру, независимо от используемого устройства, эффективно и бесшовно передавать данные и обмениваться информацией. Этот открытый стандарт обеспечивает надежную сетевую основу для распределенного совместного обучения.

Проверка (Verification): обеспечить доверие и безопасность

В децентрализованной сети, не требующей доверия, подтверждение того, что результаты вычислений, представленные всеми участниками, являются истинными и действительными, представляет собой большую проблему. Для этого Gensyn внедрила специальный протокол проверки, который направлен на обеспечение всех поставщиков вычислительной мощности правильными рабочими результатами с помощью недорогого и эффективного механизма:

  • Протокол верификации Verde: Verde является первой системой верификации, специально разработанной для современных методов машинного обучения. Его основная идея заключается в использовании легковесного механизма разрешения споров для быстрого определения шага, на котором возникли разногласия между моделью и верификатором в процессе обучения. В отличие от традиционных методов верификации, требующих повторного запуска всей задачи, Verde требует только перерасчета спорных операций, что значительно снижает затраты на верификацию.
  • реферируемая делегация (裁决式委托): применяя этот метод, если у какого-либо поставщика возникают проблемы с выводом, валидатор сможет убедить нейтрального арбитра через эффективную игру разрешения споров, что правильность всего вычислительного результата обеспечивается при наличии хотя бы одного честного узла.
  • Хранение и хэширование промежуточных состояний: для поддержки вышеуказанного процесса верификации участникам необходимо хранить и хэшировать лишь часть промежуточных контрольных точек обучения, а не все данные, что снижает нагрузку на ресурсы и повышает масштабируемость и оперативность системы.
Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить