Crypto AI'nin Kutsal Kasesi: Merkeziyetsizlik ile Eğitimdeki Sınırları Zorlamak
AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve teknik engeli en yüksek aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasındaki hafif çağrılara kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritmaları desteği gerektirir, bu da AI sisteminin inşası için gerçek bir "ağır sanayi"dir. Mimari paradigmalara göre, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitim.
Merkeziyetsiz eğitim, tek bir kurumun yerel yüksek performanslı kümeler içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir. Donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilerek çalıştırılır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır; bu da GPT, Gemini gibi büyük ölçekli modellerin eğitimi için çok uygundur. Yüksek verimlilik ve kontrol edilebilir kaynaklar gibi avantajları vardır, ancak veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da mevcuttur.
Dağıtık eğitim, günümüzde büyük model eğitiminde ana akım bir yöntemdir, temelinde model eğitim görevlerinin parçalara ayrılması ve çok sayıda makineye dağıtılarak işbirliği içinde gerçekleştirilmesi yatmaktadır. Bu, tek bir makinenin hesaplama ve depolama darboğazlarını aşmak içindir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol, planlama ve senkronize edilir; genellikle yüksek hızlı yerel alan ağları ortamında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, alt görevleri koordine eder. Ana akım yöntemler şunları içerir:
Veri paralelliği: Her düğüm, farklı veri parametrelerini paylaşarak eğitim yapar, model ağırlıklarının eşleşmesi gerekmektedir.
Model paralelliği: Modelin farklı kısımlarını farklı düğümlerde dağıtarak güçlü ölçeklenebilirlik sağlama
Boru hattı paralelliği: Aşamalı seri yürütme, verimliliği artırır.
Tensör paralelliği: Matris hesaplamalarını ince bir şekilde bölerek paralel granülasyonu artırma
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur; bu, aynı patronun uzaktan birden fazla "ofis" çalışanını görevi tamamlamak için koordine etmesine benzer. Şu anda, hemen hemen tüm ana akım büyük modeller (GPT-4, Gemini, LLaMA vb. ) bu şekilde eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre karşı dayanıklı bir gelecek yolu temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm (, ev bilgisayarları, bulut GPU'ları veya kenar cihazları ), merkezi bir koordinatör olmaksızın eğitim görevlerini işbirliği içinde tamamlayabilir; genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanır ve katkının dürüstlüğünü güvence altına almak için kriptografik teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Cihaz heterojenliği ve bölme zorluğu: Heterojen cihazların koordinasyonu zor, görev bölme verimliliği düşük
İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyonu darboğazı belirgin
Birlikte koordinasyon eksikliği: Merkezi bir denetleyici yok, görev dağıtımı ve hata geri alma mekanizması karmaşık.
Merkeziyetsizlik eğitimi, global bir gönüllü grubunun, her birinin hesap gücü katkısıyla model eğitimi yaptığı şeklinde anlaşılabilir. Ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğu olup, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok yönü kapsamaktadır. Ancak "etkili işbirliği + dürüstlük teşviki + doğru sonuçlar" sağlanabilir mi, hala erken prototip keşif aşamasındadır.
Federal öğrenme, dağıtılmışlık ve Merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular. Bu durum, gizlilik uyumuna önem veren senaryolar için uygundur, örneğin sağlık hizmetleri, finans gibi (. Federal öğrenme, dağıtılmış eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahipken, aynı zamanda Merkeziyetsizlik eğitimindeki veri dağılım avantajlarına da sahiptir; ancak hala güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında "kontrollü merkeziyetsizlik" çözümü olarak görülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından nispeten ılımlıdır ve sanayi için geçiş aşaması dağıtım yapısı olarak daha uygundur.
![Crypto AI'nin Kutsal Kadehi: Merkeziyetsizlik Eğitiminin Sınırları])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsiz eğitim tüm görev türleri için uygun değildir. Belirli senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya iş birliği zorluğu nedeniyle, doğal olarak heterojen, güvenilmez düğümler arasında verimli bir şekilde tamamlanması zordur. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, bu nedenle açık ağlarda etkili bir şekilde bölünmesi ve senkronize edilmesi zorlaşır; veri gizliliği ve egemenlik kısıtlamalarının güçlü olduğu görevler ), tıbbi, finansal ve gizli veriler ( gibi, yasal uyum ve etik kısıtlamalar nedeniyle açık paylaşım yapılamaz; ve iş birliği teşvik temellerinin eksik olduğu görevler ), işletme kapalı kaynak modelleri veya iç prototip eğitimi ( gibi, dış katılım motivasyonundan yoksundur. Bu sınırlamalar, mevcut merkeziyetsiz eğitim için gerçek sınırlamaları oluşturmaktadır.
Ancak bu, merkeziyetsizlik eğitimlerinin sahte bir kavram olduğu anlamına gelmez. Gerçekten de, yapı olarak hafif, paralel çalışmaya uygun ve teşvik edici görev türlerinde merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri ) gibi RLHF, DPO (, veri toplama eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genellikle yüksek paralellik, düşük bağımlılık ve heterojen hesaplama gücüne tolerans özelliklerine sahip olup, P2P ağlar, Swarm protokolü, dağıtık optimizasyon gibi yöntemlerle işbirlikçi eğitim için son derece uygundur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikle Eğitimdeki Sınırları Zorlamak])https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(
Merkeziyetsizlik Eğitimi Klasik Proje Analizi
Şu anda merkeziyetsizlik eğitimi ve federatif öğrenme öncülüğünde, temsilci blockchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilik ve mühendislik gerçekleştirme zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda birçok özgün keşif sunmakta, mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise nispeten açıktır ve ilk mühendislik ilerlemeleri görülebilmektedir. Bu makale, bu beş projenin arkasındaki temel teknolojileri ve mühendislik mimarilerini sırayla analiz edecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkileri daha da tartışacaktır.
) Prime Intellect: Eğitim izleri doğrulanabilir güçlendirilmiş öğrenme işbirliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır; böylece herkes eğitime katılabilir ve hesaplama katkılarından güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST adlı üç temel modül aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizmalarının tamamlandığı merkeziyetsiz bir AI eğitim sistemi kurmayı hedeflemektedir.
01, Prime Intellect protokol yığını yapısı ve ana modül değerleri
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırlarını Keşfetmek]###https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(
)# 02, Prime Intellect eğitimi anahtar mekanizması ayrıntılı açıklaması
#PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitimi senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ve asenkron katılım için tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir şekilde görev döngüsünü tamamlayabilir ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir planlama ortamında esnek eğitimi gerçekleştirmek için daha uygundur; bu, sistem karmaşıklığını azaltmakla kalmaz, aynı zamanda çoklu görev paralelliğini ve strateji evrimini desteklemek için bir temel oluşturur.
#TOPLOC:Ağır olmayan eğitim davranış doğrulama mekanizması
TOPLOC###Güvenilir Gözlem & Politika-Yerelleştirme Kontrolü(, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayanarak etkili bir politika öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan eğitim doğrulama çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz; bunun yerine "gözlem dizisi↔politika güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştürerek, güvene dayanmayan eğitim ödül dağıtımını gerçekleştirmek için kritik bir yenilik sunar ve denetlenebilir, teşvik edici merkeziyetsiz işbirliği eğitim ağı inşa etmek için uygulanabilir bir yol sağlar.
#SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan bir ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmadan sürekli kısmi güncellemeler göndermesine olanak tanır, bu sayede ağırlıkların kademeli yakınsaması ve çoklu versiyon evrimi sağlanır. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetsiz eğitimin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır, bu da kararlı ağırlık konsensüsü ve sürekli eğitim iterasyonu oluşturmanın temel altyapısını sağlar.
#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibi tarafından DeepMind'ın önerdiği DiLoCo kavramının bağımsız olarak uygulanmış ve açık kaynak kodlu bir iletişim optimizasyon çerçevesidir. Merkeziyetsizlik eğitiminde yaygın olarak karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları inşa ederek, küresel senkronizasyonun yüksek iletişim maliyetinden kaçınmakta ve model işbirliği eğitimini yalnızca yerel komşu düğümlere dayanarak tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizması ile OpenDiLoCo, tüketici sınıfı GPU'lar ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlamaktadır. Bu, küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırmakta ve merkeziyetsizlik eğitim ağı oluşturmanın ana iletişim altyapılarından biri olmaktadır.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL)Prime Collective Communication Library(, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir; geleneksel iletişim kütüphanelerinin ), NCCL, Gloo( gibi heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyet senkronizasyonunu ve kesintiden kurtarmayı destekler, tüketici düzeyindeki GPU'larda ve istikrarsız düğümlerde çalışabilir, OpenDiLoCo protokolü için asenkron iletişim yeteneklerini destekleyen alt bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güven gerektirmeyen işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını oluşturmaktadır.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikle Eğitimdeki Sınırları Zorlamak])https://img-cdn.gateio.im/webp-social/moments-0a322ea8b70c3d00d8d99606559c1864.webp(
)# 03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herhangi birinin görevlere katılmasını ve gerçek katkılarına dayalı olarak ödüller kazanmasını sağlayan, izinsiz, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etti. Protokol, üç ana rol türüne dayanarak çalışır:
Görev başlatıcısı: eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar
Eğitim düğümü: Yerel eğitim yürütme, ağırlık güncellemelerini gönderme ve gözlem izlerini paylaşma
Doğrulama düğümü: Eğitim davranışının gerçekliğini doğrulamak için TOPLOC mekanizmasını kullanır ve ödül hesaplaması ile strateji birleştirmeye katılır.
Protokolün temel süreci, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ###SHARDCAST( ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngü oluşturur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Sınırları Zorlamak])
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
16 Likes
Reward
16
3
Share
Comment
0/400
quiet_lurker
· 07-15 01:11
Aman Tanrım, sadece büyük şirketlerin bilgi işlem gücü tekelidir.
View OriginalReply0
RektButStillHere
· 07-15 01:07
Zor bir durum, merkeziyetçi eğitim hâlâ çok fazla kaynak alıyor.
Merkeziyetsizlik AI eğitiminde öncü keşifler: PRIME-RL'den INTELLECT-2'ye
Crypto AI'nin Kutsal Kasesi: Merkeziyetsizlik ile Eğitimdeki Sınırları Zorlamak
AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve teknik engeli en yüksek aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasındaki hafif çağrılara kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritmaları desteği gerektirir, bu da AI sisteminin inşası için gerçek bir "ağır sanayi"dir. Mimari paradigmalara göre, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitim.
Merkeziyetsiz eğitim, tek bir kurumun yerel yüksek performanslı kümeler içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir. Donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilerek çalıştırılır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır; bu da GPT, Gemini gibi büyük ölçekli modellerin eğitimi için çok uygundur. Yüksek verimlilik ve kontrol edilebilir kaynaklar gibi avantajları vardır, ancak veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da mevcuttur.
Dağıtık eğitim, günümüzde büyük model eğitiminde ana akım bir yöntemdir, temelinde model eğitim görevlerinin parçalara ayrılması ve çok sayıda makineye dağıtılarak işbirliği içinde gerçekleştirilmesi yatmaktadır. Bu, tek bir makinenin hesaplama ve depolama darboğazlarını aşmak içindir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol, planlama ve senkronize edilir; genellikle yüksek hızlı yerel alan ağları ortamında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, alt görevleri koordine eder. Ana akım yöntemler şunları içerir:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur; bu, aynı patronun uzaktan birden fazla "ofis" çalışanını görevi tamamlamak için koordine etmesine benzer. Şu anda, hemen hemen tüm ana akım büyük modeller (GPT-4, Gemini, LLaMA vb. ) bu şekilde eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre karşı dayanıklı bir gelecek yolu temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm (, ev bilgisayarları, bulut GPU'ları veya kenar cihazları ), merkezi bir koordinatör olmaksızın eğitim görevlerini işbirliği içinde tamamlayabilir; genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanır ve katkının dürüstlüğünü güvence altına almak için kriptografik teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Merkeziyetsizlik eğitimi, global bir gönüllü grubunun, her birinin hesap gücü katkısıyla model eğitimi yaptığı şeklinde anlaşılabilir. Ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğu olup, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok yönü kapsamaktadır. Ancak "etkili işbirliği + dürüstlük teşviki + doğru sonuçlar" sağlanabilir mi, hala erken prototip keşif aşamasındadır.
Federal öğrenme, dağıtılmışlık ve Merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular. Bu durum, gizlilik uyumuna önem veren senaryolar için uygundur, örneğin sağlık hizmetleri, finans gibi (. Federal öğrenme, dağıtılmış eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahipken, aynı zamanda Merkeziyetsizlik eğitimindeki veri dağılım avantajlarına da sahiptir; ancak hala güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında "kontrollü merkeziyetsizlik" çözümü olarak görülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından nispeten ılımlıdır ve sanayi için geçiş aşaması dağıtım yapısı olarak daha uygundur.
![Crypto AI'nin Kutsal Kadehi: Merkeziyetsizlik Eğitiminin Sınırları])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsiz eğitim tüm görev türleri için uygun değildir. Belirli senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya iş birliği zorluğu nedeniyle, doğal olarak heterojen, güvenilmez düğümler arasında verimli bir şekilde tamamlanması zordur. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, bu nedenle açık ağlarda etkili bir şekilde bölünmesi ve senkronize edilmesi zorlaşır; veri gizliliği ve egemenlik kısıtlamalarının güçlü olduğu görevler ), tıbbi, finansal ve gizli veriler ( gibi, yasal uyum ve etik kısıtlamalar nedeniyle açık paylaşım yapılamaz; ve iş birliği teşvik temellerinin eksik olduğu görevler ), işletme kapalı kaynak modelleri veya iç prototip eğitimi ( gibi, dış katılım motivasyonundan yoksundur. Bu sınırlamalar, mevcut merkeziyetsiz eğitim için gerçek sınırlamaları oluşturmaktadır.
Ancak bu, merkeziyetsizlik eğitimlerinin sahte bir kavram olduğu anlamına gelmez. Gerçekten de, yapı olarak hafif, paralel çalışmaya uygun ve teşvik edici görev türlerinde merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri ) gibi RLHF, DPO (, veri toplama eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genellikle yüksek paralellik, düşük bağımlılık ve heterojen hesaplama gücüne tolerans özelliklerine sahip olup, P2P ağlar, Swarm protokolü, dağıtık optimizasyon gibi yöntemlerle işbirlikçi eğitim için son derece uygundur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikle Eğitimdeki Sınırları Zorlamak])https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(
Merkeziyetsizlik Eğitimi Klasik Proje Analizi
Şu anda merkeziyetsizlik eğitimi ve federatif öğrenme öncülüğünde, temsilci blockchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilik ve mühendislik gerçekleştirme zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda birçok özgün keşif sunmakta, mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise nispeten açıktır ve ilk mühendislik ilerlemeleri görülebilmektedir. Bu makale, bu beş projenin arkasındaki temel teknolojileri ve mühendislik mimarilerini sırayla analiz edecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkileri daha da tartışacaktır.
) Prime Intellect: Eğitim izleri doğrulanabilir güçlendirilmiş öğrenme işbirliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır; böylece herkes eğitime katılabilir ve hesaplama katkılarından güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST adlı üç temel modül aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizmalarının tamamlandığı merkeziyetsiz bir AI eğitim sistemi kurmayı hedeflemektedir.
01, Prime Intellect protokol yığını yapısı ve ana modül değerleri
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırlarını Keşfetmek]###https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(
)# 02, Prime Intellect eğitimi anahtar mekanizması ayrıntılı açıklaması
#PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitimi senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ve asenkron katılım için tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir şekilde görev döngüsünü tamamlayabilir ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir planlama ortamında esnek eğitimi gerçekleştirmek için daha uygundur; bu, sistem karmaşıklığını azaltmakla kalmaz, aynı zamanda çoklu görev paralelliğini ve strateji evrimini desteklemek için bir temel oluşturur.
#TOPLOC:Ağır olmayan eğitim davranış doğrulama mekanizması
TOPLOC###Güvenilir Gözlem & Politika-Yerelleştirme Kontrolü(, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayanarak etkili bir politika öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan eğitim doğrulama çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz; bunun yerine "gözlem dizisi↔politika güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştürerek, güvene dayanmayan eğitim ödül dağıtımını gerçekleştirmek için kritik bir yenilik sunar ve denetlenebilir, teşvik edici merkeziyetsiz işbirliği eğitim ağı inşa etmek için uygulanabilir bir yol sağlar.
#SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan bir ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmadan sürekli kısmi güncellemeler göndermesine olanak tanır, bu sayede ağırlıkların kademeli yakınsaması ve çoklu versiyon evrimi sağlanır. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetsiz eğitimin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır, bu da kararlı ağırlık konsensüsü ve sürekli eğitim iterasyonu oluşturmanın temel altyapısını sağlar.
#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibi tarafından DeepMind'ın önerdiği DiLoCo kavramının bağımsız olarak uygulanmış ve açık kaynak kodlu bir iletişim optimizasyon çerçevesidir. Merkeziyetsizlik eğitiminde yaygın olarak karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları inşa ederek, küresel senkronizasyonun yüksek iletişim maliyetinden kaçınmakta ve model işbirliği eğitimini yalnızca yerel komşu düğümlere dayanarak tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizması ile OpenDiLoCo, tüketici sınıfı GPU'lar ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlamaktadır. Bu, küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırmakta ve merkeziyetsizlik eğitim ağı oluşturmanın ana iletişim altyapılarından biri olmaktadır.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL)Prime Collective Communication Library(, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir; geleneksel iletişim kütüphanelerinin ), NCCL, Gloo( gibi heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyet senkronizasyonunu ve kesintiden kurtarmayı destekler, tüketici düzeyindeki GPU'larda ve istikrarsız düğümlerde çalışabilir, OpenDiLoCo protokolü için asenkron iletişim yeteneklerini destekleyen alt bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güven gerektirmeyen işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını oluşturmaktadır.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikle Eğitimdeki Sınırları Zorlamak])https://img-cdn.gateio.im/webp-social/moments-0a322ea8b70c3d00d8d99606559c1864.webp(
)# 03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herhangi birinin görevlere katılmasını ve gerçek katkılarına dayalı olarak ödüller kazanmasını sağlayan, izinsiz, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etti. Protokol, üç ana rol türüne dayanarak çalışır:
Protokolün temel süreci, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ###SHARDCAST( ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngü oluşturur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Sınırları Zorlamak])