2026 Começo de ano, a arquitetura mHC da DeepSeek deu mais um passo à frente.
Falando nisso, o HC sempre enfrentou gargalos de expansão na direção da largura — estabilidade fraca, escalabilidade limitada. O mHC foi criado para quebrar esse impasse. Ele não apenas mantém a abordagem tradicional de empilhamento vertical do transformer, mas o mais importante é que abriu a porta para fluxos de informação paralelos na horizontal, tornando possível múltiplos fluxos em paralelo.
O que isso significa? O modelo pode ser empilhado verticalmente e também estendido horizontalmente. A dimensão de expansão passou de uma para duas dimensões. Continuando a escalabilidade, o teto foi elevado mais uma vez.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
6 Curtidas
Recompensa
6
4
Repostar
Compartilhar
Comentário
0/400
LiquidationOracle
· 2h atrás
Uau, mHC, esta coisa realmente surpreende, a ideia de expansão bidimensional é realmente ousada
Ver originalResponder0
Hash_Bandit
· 2h atrás
ngl, a coisa de escalonamento 2D parece familiar... não foi basicamente isso que tentámos com o clustering inicial de ASICs? a capacidade de processamento horizontal acaba sempre por atingir limites térmicos. acho que vamos ver se o deepseek realmente descobriu o ponto ideal de paralelização desta vez ou se é apenas o ciclo habitual de hype a girar novamente.
Ver originalResponder0
AirdropHunterKing
· 3h atrás
Amigo, se este mHC realmente puder se espalhar horizontalmente e empilhar verticalmente, será uma jogada de exploração de duas dimensões, a escalabilidade vai economizar muita taxa de gás.
A jogada do DeepSeek foi boa, mas temos que ver como será a implementação futura. Por mais que seja bem divulgada, ainda temos que esperar os dados reais de interação para falar.
Aquelas otimizações de arquitetura anteriores não acabaram sendo apenas moedas de ar, espero que desta vez não seja mais uma encenação.
Ver originalResponder0
AirdropDreamer
· 3h atrás
Escalonamento bidimensional, agora realmente é diferente, tanto na horizontal quanto na vertical, parece que o teto não tem fim
2026 Começo de ano, a arquitetura mHC da DeepSeek deu mais um passo à frente.
Falando nisso, o HC sempre enfrentou gargalos de expansão na direção da largura — estabilidade fraca, escalabilidade limitada. O mHC foi criado para quebrar esse impasse. Ele não apenas mantém a abordagem tradicional de empilhamento vertical do transformer, mas o mais importante é que abriu a porta para fluxos de informação paralelos na horizontal, tornando possível múltiplos fluxos em paralelo.
O que isso significa? O modelo pode ser empilhado verticalmente e também estendido horizontalmente. A dimensão de expansão passou de uma para duas dimensões. Continuando a escalabilidade, o teto foi elevado mais uma vez.