تقنية جديدة من جوجل تثير رعب السوق، طلب الذاكرة الذكية يقل بمقدار ستة أضعاف! SK هاليكسا و Micron يخفضان الأسعار بشكل متزامن

ChainNewsAbmedia

جوجل تطلق خوارزمية TurboQuant، التي تقلل من استهلاك الذاكرة لنماذج اللغة الكبيرة بمقدار 6 مرات على الأقل، مع تحسين سرعة الاستنتاج بنسبة تصل إلى 8 أضعاف دون التضحية بدقة النموذج. سرعان ما فُسرت هذه التقنية في السوق على أنها “تدمير من جانب الطلب”، حيث أن المنطق وراء ذلك واضح جدًا: إذا تم ضغط متطلبات الذاكرة أثناء استنتاج الذكاء الاصطناعي بعدة مرات، فإن منحنى الطلب على DRAM و HBM وحتى NAND في مراكز البيانات قد يشهد تراجعًا هيكليًا في المستقبل.

بعد الإعلان، شهدت أسهم الذاكرة والتخزين تراجعًا متزامنًا، بما في ذلك SanDisk (SNDK) بانخفاض 3.5%، Micron Technology (MU) بانخفاض 3.4%، Western Digital (WDC) بانخفاض 1.63%. وفي سلسلة التوريد الآسيوية، انخفضت Samsung Electronics بنسبة 4.71%، وSK Hynix بنسبة 6.23%. وهناك آراء ترى أن TurboQuant ربما يغير بشكل أكبر “كفاءة استخدام الموارد” بدلاً من مجرد تقليل الطلب.

أحدث خوارزمية من جوجل: استهلاك الذاكرة أقل بمقدار 6 مرات، وسرعة الاستنتاج أسرع بمقدار 8 أضعاف

وفقًا لشرح فريق بحث جوجل، فإن TurboQuant هو خوارزمية كوانتة (quantization) مصممة لنماذج اللغة الكبيرة وأنظمة البحث بالمتجهات، وتتمحور حول ضغط كبير على أكثر مكونات النموذج استهلاكًا للموارد، وهي “ذاكرة الكاش المفتاحية والقيم” (key-value cache) والبيانات ذات الأبعاد العالية. في الاختبارات، تمكنت التقنية من تقليل استهلاك الذاكرة بمقدار 6 مرات على الأقل، مع تحسين سرعة الاستنتاج حتى 8 أضعاف دون التضحية بدقة النموذج.

(ما الذي يغيره Vera Rubin من NVIDIA؟ تحليل عصر حرب الذاكرة: SK Hynix، سامسونج، ميكرون، SanDisk)

هذا الاختراق يضرب مباشرة في أحد العقبات الرئيسية للبنية التحتية الحالية للذكاء الاصطناعي. فالنموذج التوليدي يعتمد بشكل كبير على ذاكرات عالية التردد مثل HBM لتحمل أوزان النموذج وذاكرة الكاش الكبيرة، وتجنب توقف الذاكرة أثناء الاستنتاج. ومع ذلك، فإن TurboQuant، من خلال دمج PolarQuant وQuantized Johnson-Lindenstrauss (QJL) وغيرها من الطرق، يحقق ضغطًا تقريبًا بدون “أي استهلاك إضافي للذاكرة”، مما يعني إنجاز عمليات أكثر كفاءة باستخدام موارد أقل.

خوارزمية Google تؤثر على الذاكرة! شركات الذاكرة في أمريكا وكوريا تتراجع

سرعان ما فُسرت التقنية على أنها “تدمير من جانب الطلب”. بعد الإعلان، شهدت أسهم الذاكرة والتخزين تراجعًا، بما في ذلك SanDisk (SNDK) بانخفاض 3.5%، Micron Technology (MU) بانخفاض 3.4%، Western Digital (WDC) بانخفاض 1.63%. وفي آسيا، انخفضت Samsung Electronics بنسبة 4.71%، وSK Hynix بنسبة 6.23%.

المنطق وراء ذلك بسيط جدًا: إذا تم ضغط متطلبات الذاكرة أثناء استنتاج الذكاء الاصطناعي بعدة مرات، فإن منحنى الطلب على DRAM و HBM وحتى NAND في مراكز البيانات قد يشهد تراجعًا هيكليًا. خاصة مع انتقال صناعة الذكاء الاصطناعي تدريجيًا من “التركيز على التدريب” إلى “التركيز على الاستنتاج”، فإن تأثير تقنيات الكفاءة سيُعزز بشكل أكبر.

ومع ذلك، هناك آراء ترى أن TurboQuant ربما يغير بشكل أكبر “كفاءة استخدام الموارد” بدلاً من مجرد تقليل الطلب. مع انخفاض التكاليف وتقليل التأخير، قد تتوسع تطبيقات الذكاء الاصطناعي أكثر، مما يدفع الطلب الإجمالي على الحوسبة إلى النمو، مكونًا هيكلية “انخفاض الطلب لكل وحدة، وزيادة الطلب الإجمالي”. جميع قدرات الإنتاج لدى كبار شركات الذاكرة هذا العام قد بيعت بالكامل، وربما السوق يتساءل: ما هو الحد الأقصى لنمو الذكاء الاصطناعي؟

هذه المقالة عن تقنية جوجل الجديدة التي أذهلت السوق، حيث يقل الطلب على ذاكرة الذكاء الاصطناعي بمقدار 6 مرات! وتراجع شركات SK Hynix وMicron بشكل متزامن. نشرت لأول مرة على Chain News ABMedia.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات