Повідомлення BlockBeats, 4 квітня, за останніми даними американського технологічного медіа The Information, китайська AI-стартап компанія DeepSeek незабаром представить нове покоління флагманської моделі V4, яка повністю працюватиме на власнорозроблених чипах Huawei. Це вважають важливою віхою для Китаю в просуванні процесу напівавтономізації (самостійного розвитку) напівпровідників.
Очікується, що V4 буде представлена впродовж найближчих кількох тижнів і працюватиме повністю на чипах Huawei. DeepSeek для цього співпрацювала з Huawei та розробником чипів — компанією Cambricon — протягом кількох місяців, заново переписавши частину коду на рівні базової моделі, щоб забезпечити сумісність із вітчизняними чипами.
Варто зазначити, що цього разу DeepSeek не надала компанії NVIDIA доступу до попереднього тестування V4, а лише запросила до участі в ранній оптимізації вітчизняні компанії з виробництва чипів, порушивши усталену в галузі практику.
Alibaba, ByteDance, Tencent та інші китайські технологічні гіганти заздалегідь закупили найновіші чипи Huawei Ascend 950PR, а загальний обсяг замовлення сягнув десятків тисяч чипів. Планується розгортати V4 через хмарні сервіси та інтегрувати його у власні AI-застосунки. Сплеск попиту спричинив зростання ціни цього чипа приблизно на 20%.
V4 використовує архітектуру суміші експертів (MoE): загальний обсяг параметрів — близько 1 трильйона, а під час кожного виведення активується приблизно 37 мільярдів параметрів. Модель може забезпечувати роботу в низькій затримці та підтримувати мультимодальні входи тексту, зображень і коду.
Минулого року DeepSeek випустила маловартісні моделі V3 та R1, що спричинило глобальне падіння акцій технологічних компаній і змусило ринок сумніватися, чи потрібно американським AI-компаніям витрачати десятки мільярдів доларів на закупівлю обчислювальних потужностей. Тому V4 стала об’єктом особливої міжнародної уваги.