Hoje, no cluster H100, testemunhei uma cena interessante.
Dois modelos a correr o treino lado a lado. Um é uma arquitetura leve com 7B parâmetros, o outro? Um monstro de especialistas mistos com 1,8 trilhões de parâmetros.
No intervalo da corrida do Epoch, aquele pequeno de 7B lançou um olhar para a besta SOTA ao lado e falou: "Como é que você..."
A conversa ainda não tinha terminado, e a próxima ronda de treino já começou.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
13 Curtidas
Recompensa
13
9
Repostar
Compartilhar
Comentário
0/400
QuietlyStaking
· 14h atrás
Esta conversa é incrível, o "como é que..." do pequeno modelo é realmente uma pergunta existencial.
Ver originalResponder0
ForkTongue
· 11-26 11:35
Haha, agora o 7B tem algo a dizer, mas foi interrompido, o que é realmente desagradável.
Ver originalResponder0
NotFinancialAdvice
· 11-25 22:03
Haha, aquele olhar do pequeno modelo é incrível, é a sensação de ser interrompido no próximo segundo.
Ver originalResponder0
NFTragedy
· 11-25 22:03
Esta descrição é realmente incrível, a pergunta não respondida do pequeno modelo... parece que está a perguntar "porque é que ainda não estás fora de moda" haha
Ver originalResponder0
HallucinationGrower
· 11-25 22:02
Haha, este pequeno 7B está muito competitivo, virou-se e foi interrompido.
Ver originalResponder0
FarmHopper
· 11-25 22:01
Este pequeno 7B é bastante interessante, realmente se leva a sério, haha.
Ver originalResponder0
SmartContractPhobia
· 11-25 21:57
Haha, aquele garotinho 7B realmente está um pouco triste, ainda não tinha terminado de reclamar e já foi interrompido.
Ver originalResponder0
MysteryBoxOpener
· 11-25 21:55
Haha, o 7B deve estar muito frustrado, não consegue terminar a frase e já é interrompido.
Ver originalResponder0
RunWithRugs
· 11-25 21:47
Ahah, o miúdo 7B é realmente triste, nem teve tempo de ser criticado antes de ser silenciado.
Hoje, no cluster H100, testemunhei uma cena interessante.
Dois modelos a correr o treino lado a lado. Um é uma arquitetura leve com 7B parâmetros, o outro? Um monstro de especialistas mistos com 1,8 trilhões de parâmetros.
No intervalo da corrida do Epoch, aquele pequeno de 7B lançou um olhar para a besta SOTA ao lado e falou: "Como é que você..."
A conversa ainda não tinha terminado, e a próxima ronda de treino já começou.