Informe de Anthropic responde a la autoevolución: se ha completado un ciclo parcial, pero aún hay distancia para un entrenamiento completamente autónomo

robot
Generación de resúmenes en curso
Según el monitoreo de Beating, la capacidad de autoevolución autónoma de la IA está superando todas las expectativas. El Instituto Anthropic publicó el 5 de junio un informe titulado "Cuando la IA construye su propio ser", que revela en detalle los avances en su investigación y desarrollo en el ámbito de la "mejora recursiva". Los datos muestran que, hasta mayo de 2026, más del 80% del código fusionado en el repositorio principal de Anthropic fue escrito por Claude mismo. Antes del lanzamiento del código Claude en febrero de 2025, el código escrito por Claude representaba solo una cifra de un solo dígito. Tang Jie, fundador de Zhizhu AI, predijo el 13 de mayo que el fin de los grandes modelos sería la autoevolución, y que Claude ya podría haber alcanzado la línea base de autoentrenamiento que incluye "escribir código, limpiar datos y entrenarse a sí mismo". Sin embargo, en el informe, Anthropic aclaró que la mejora recursiva completamente autónoma y diseñada para sucesores aún no se ha logrado. El papel de la IA en la cadena de desarrollo está en transición, de una mejora local a decisiones autónomas. En el segundo trimestre de 2026, los ingenieros de Anthropic fusionaron en promedio ocho veces más código por día que en 2024. El proceso de desarrollo actual es muy simple: los ingenieros solo planifican objetivos y revisan, mientras que Claude se encarga de la escritura y ejecución específicas. Anthropic también ha desplegado a Claude como revisor de código automático, encargado de interceptar errores y vulnerabilidades de seguridad. Esto indica que la "autoevaluación" que Tang Jie mencionó ya se ha implementado en la ingeniería, aunque la revisión humana sigue siendo la última línea de seguridad. La fiabilidad del modelo para ejecutar tareas de larga duración de forma independiente también se ha duplicado. La duración que el modelo puede trabajar de forma autónoma se duplica aproximadamente cada cuatro meses. En marzo de 2024, Claude 3 Opus solo podía manejar tareas simples de 4 minutos. Un año después, Claude 3.7 Sonnet puede soportar 1.5 horas. Para marzo de 2026, Claude 4.6 Opus ya puede afrontar tareas complejas de 12 horas. Datos de la organización de evaluación METR muestran que la versión preliminar de Claude Mythos puede trabajar de forma autónoma durante más de 16 horas, acercándose al límite de las herramientas de evaluación actuales. A la velocidad actual, para 2027, la IA será capaz de gestionar tareas de investigación que normalmente tomarían semanas a los humanos, ayudando a las empresas a dar el salto de "empresa unipersonal" a "empresa sin personal". En cuanto a la hipótesis de Tang Jie sobre la "línea base de autoentrenamiento", el informe revela en realidad un "ciclo de experimento en miniatura" parcial. En experimentos de aceleración del código de entrenamiento de modelos pequeños, en mayo de 2025, Claude 4 Opus solo logró triplicar la velocidad del código, mientras que en abril de 2026, la versión preliminar de Claude Mythos alcanzó una aceleración de 52 veces. En comparación, los mejores investigadores humanos suelen lograr una mejora de 4 veces en 4 a 8 horas. Sin embargo, los objetivos de optimización y los indicadores de éxito en estos experimentos son establecidos previamente por humanos. Cuando se enfrentan a una cadena completa más compleja de "limpieza de datos, generación de datos sintéticos y autoentrenamiento", la capacidad de decisión de la IA aún es deficiente. Sin embargo, el ciclo autónomo de desarrollo y mejora está llevando a los humanos al borde de perder el control final del sistema. La predicción de Tang Jie de que "el sistema operativo LLM reemplazará las arquitecturas tradicionales y las aplicaciones se generarán bajo demanda en tiempo real" implica que en el futuro, las computadoras ejecutarán código dinámico que no podrá ser revisado con anticipación; mientras que la advertencia de Anthropic de que "la revisión humana no podrá seguir la autoevolución de la IA" significa que ni siquiera podremos controlar la fuente del código generado. Cuando la IA comience a diseñar y entrenar sucesores de forma autónoma, la evolución del software se convertirá en una caja negra. Permitir que la IA realice autoevolución sin auditoría humana en un sistema de caja negra hará que la seguridad, el monitoreo y la alineación del comportamiento de los sistemas de mejora automática sean extremadamente difíciles de gestionar.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado