DeepSeek, une start-up d'intelligence artificielle basée à Hangzhou, en Chine, a lancé fin décembre 2024 le modèle de langage DeepSeek-V3, qui a attiré l'attention de l'industrie mondiale de l'intelligence artificielle. Le modèle compte 671 milliards de paramètres, mais il a été entraîné en seulement deux mois pour un coût de 5,58 millions de dollars, bien inférieur aux investissements des autres géants technologiques. DeepSeek-V3 se distingue dans les modèles open source et est comparable aux modèles les plus avancés au monde. La société a optimisé le processus de formation pour réduire les coûts, en utilisant environ 2,78 millions d'heures de GPU Nvidia H800, fabriqués en Chine. Cela montre que les entreprises chinoises d'intelligence artificielle ont réalisé des progrès significatifs dans l'obtention de matériaux semi-conducteurs avancés nécessaires à la formation de l'IA, malgré les restrictions imposées par les États-Unis. Le succès de DeepSeek a suscité des inquiétudes dans l'industrie technologique américaine, entraînant une forte baisse des actions de Nvidia et d'autres sociétés technologiques. Les experts estiment que DeepSeek a réussi à obtenir des performances élevées à un coût bien inférieur à celui de ses concurrents américains en utilisant des technologies open source et des méthodes de formation efficaces. De plus, DeepSeek a déjà rendu public le code source du modèle et une explication technique détaillée, permettant aux chercheurs et développeurs du monde entier d'accéder et d'améliorer cette technologie. Cette transparence contraste nettement avec l'approche plus conservatrice des grandes entreprises américaines en matière d'intelligence artificielle et pourrait modifier la manière dont les entreprises technologiques développent des modèles à l'avenir.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
#Deepseek Goes Viral
DeepSeek, une start-up d'intelligence artificielle basée à Hangzhou, en Chine, a lancé fin décembre 2024 le modèle de langage DeepSeek-V3, qui a attiré l'attention de l'industrie mondiale de l'intelligence artificielle. Le modèle compte 671 milliards de paramètres, mais il a été entraîné en seulement deux mois pour un coût de 5,58 millions de dollars, bien inférieur aux investissements des autres géants technologiques.
DeepSeek-V3 se distingue dans les modèles open source et est comparable aux modèles les plus avancés au monde. La société a optimisé le processus de formation pour réduire les coûts, en utilisant environ 2,78 millions d'heures de GPU Nvidia H800, fabriqués en Chine. Cela montre que les entreprises chinoises d'intelligence artificielle ont réalisé des progrès significatifs dans l'obtention de matériaux semi-conducteurs avancés nécessaires à la formation de l'IA, malgré les restrictions imposées par les États-Unis.
Le succès de DeepSeek a suscité des inquiétudes dans l'industrie technologique américaine, entraînant une forte baisse des actions de Nvidia et d'autres sociétés technologiques. Les experts estiment que DeepSeek a réussi à obtenir des performances élevées à un coût bien inférieur à celui de ses concurrents américains en utilisant des technologies open source et des méthodes de formation efficaces.
De plus, DeepSeek a déjà rendu public le code source du modèle et une explication technique détaillée, permettant aux chercheurs et développeurs du monde entier d'accéder et d'améliorer cette technologie. Cette transparence contraste nettement avec l'approche plus conservatrice des grandes entreprises américaines en matière d'intelligence artificielle et pourrait modifier la manière dont les entreprises technologiques développent des modèles à l'avenir.