La red CoinWorld informa que Luo Fuli afirma que la competencia en grandes modelos está pasando de la era del chat centrada en el preentrenamiento a la era de los agentes centrada en el entrenamiento posterior, donde lo esencial es la expansión del aprendizaje reforzado en los agentes. La distribución de potencia de cálculo ha cambiado de 3:5:1 a 3:1:1, con una inversión casi igual en preentrenamiento y entrenamiento posterior, y los equipos de élite invierten aproximadamente en una proporción de 1:1 en ambos. Además, la arquitectura del sistema también está en actualización, enfatizando una infraestructura basada en agentes, que soporta la programación de clústeres heterogéneos y puede tolerar interrupciones e incertidumbres en flujos de trabajo complejos.

CoinNetwork

2026-04-24 04:31:47

Generación de resúmenes en curso

Noticia de CoinWorld, Luo Fulili afirmó que la competencia en modelos grandes ha pasado de una era dominada por el preentrenamiento en chat a una era liderada por agentes posteriores al entrenamiento. El punto clave actual es cómo escalar el aprendizaje reforzado en los agentes. Ella reveló que, en la era del chat, la proporción de potencia computacional utilizada para investigación, preentrenamiento y postentrenamiento era aproximadamente 3:5:1, mientras que en la era actual de los agentes, la proporción razonable de distribución de recursos computacionales se ha convertido en 3:1:1, es decir, la inversión en preentrenamiento y postentrenamiento es prácticamente equivalente, y los equipos de modelos de élite ya han alcanzado una proporción de inversión de 1:1 en estas dos áreas. Además, los requisitos de la arquitectura del sistema también han cambiado drásticamente; en el pasado, la infraestructura de aprendizaje reforzado se centraba principalmente en el motor de inferencia del modelo, pero ahora la infraestructura debe centrarse en los agentes, soportar la programación de clústeres heterogéneos y tolerar la interrupción de los agentes en flujos de trabajo complejos debido a diversos factores impredecibles.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
WCTCTradingChallengeShare8MUSDT
89.87K Popularidad
#
CryptoMarketSeesVolatility
205.6K Popularidad
#
IsraelStrikesIranBTCPlunges
30.82K Popularidad
#
rsETHAttackUpdate
59.43K Popularidad
#
US-IranTalksStall
93.54K Popularidad

Anclado

Lofli: Los grandes modelos ingresan en la era posterior al entrenamiento, con la relación de potencia computacional entre preentrenamiento y postentrenamiento de los equipos de élite alcanzando 1:1

Temas de actualidad

WCTCTradingChallengeShare8MUSDT

CryptoMarketSeesVolatility

IsraelStrikesIranBTCPlunges

rsETHAttackUpdate

US-IranTalksStall

Anclado