Ler para transferir a aplicação Gate
qrCode
Mais opções de transferência
Não me lembre disso novamente hoje.

A última iteração do Grok acabou de lançar alguns números interessantes. A versão 4.1 Rápida com capacidades de raciocínio atingiu 93.5 no benchmark Extended NYT Connections—um salto de 1.4 pontos em relação ao 92.1 do predecessor.



O que chamou a atenção? O modo padrão (sem raciocínio) também viu ganhos, subindo para 25,8. Nenhum anúncio chamativo, apenas métricas de desempenho atualizadas foram divulgadas discretamente.

Para contextualizar, esses benchmarks testam modelos de linguagem em tarefas complexas de reconhecimento de padrões. A melhoria do modo de raciocínio sugere um processamento lógico aprimorado, enquanto a atualização do modelo base indica refinamentos na arquitetura geral.

As atualizações de versão como esta normalmente refletem otimizações de treinamento iterativas em vez de redesenhos fundamentais. Ainda assim, os ganhos consistentes em ambos os modos apontam para um progresso significativo nas capacidades do modelo.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 1
  • Republicar
  • Partilhar
Comentar
0/400
TheShibaWhisperervip
· 8h atrás
Outra atualização discreta? O método da Grok é bastante astuto, os números podem ser vistos, mas não há nada de novo interessante 🤔
Ver originalResponder0
  • Fixar
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)