Lofli: Los grandes modelos ingresan en la era posterior al entrenamiento, con la relación de potencia computacional entre preentrenamiento y postentrenamiento de los equipos de élite alcanzando 1:1

robot
Generación de resúmenes en curso

Noticia de CoinWorld, Luo Fulili afirmó que la competencia en modelos grandes ha pasado de una era dominada por el preentrenamiento en chat a una era liderada por agentes posteriores al entrenamiento. El punto clave actual es cómo escalar el aprendizaje reforzado en los agentes. Ella reveló que, en la era del chat, la proporción de potencia computacional utilizada para investigación, preentrenamiento y postentrenamiento era aproximadamente 3:5:1, mientras que en la era actual de los agentes, la proporción razonable de distribución de recursos computacionales se ha convertido en 3:1:1, es decir, la inversión en preentrenamiento y postentrenamiento es prácticamente equivalente, y los equipos de modelos de élite ya han alcanzado una proporción de inversión de 1:1 en estas dos áreas. Además, los requisitos de la arquitectura del sistema también han cambiado drásticamente; en el pasado, la infraestructura de aprendizaje reforzado se centraba principalmente en el motor de inferencia del modelo, pero ahora la infraestructura debe centrarse en los agentes, soportar la programación de clústeres heterogéneos y tolerar la interrupción de los agentes en flujos de trabajo complejos debido a diversos factores impredecibles.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado