Ingenieros de Ant analizaron el código fuente de Claude, revelando el mecanismo de la línea de decisión de cuatro niveles en el modo automático

Noticias de Gate News, el 25 de marzo, ingenieros de Ant Group, autores del framework frontend Umi.js, realizaron ingeniería inversa del código fuente de Claude Code 2.1.81 y restauraron completamente el mecanismo de decisión en Modo Automático. El hallazgo principal: cada llamada a herramienta pasa por una línea de cuatro decisiones, y solo cuando las tres primeras no puedan determinar, se invoca un clasificador de IA independiente para la revisión de seguridad.

La línea de decisiones consta de cuatro niveles: el primero verifica las reglas de permisos existentes, y si hay una coincidencia, se permite directamente; el segundo simula el modo acceptEdits (permiso para editar archivos), y si en este modo se aprueba, indica un riesgo muy bajo y se omite el clasificador; el tercero revisa la lista blanca de herramientas de solo lectura (Read, Grep, Glob, LSP, WebSearch, etc.), que no modifican ningún estado y se permiten sin condiciones; si ninguna de estas condiciones se cumple, se pasa al cuarto nivel, que envía una solicitud API independiente a Claude Sonnet para clasificación de seguridad.

Los detalles clave del diseño del clasificador incluyen: usar siempre Sonnet en lugar de Opus, como un equilibrio entre costo y latencia; establecer la temperatura en 0 para garantizar resultados deterministas; el clasificador se define como un «monitor de seguridad para agentes autónomos de programación IA», protegiendo contra tres tipos de riesgos (inyección de prompts, propagación de alcance, daños accidentales); el archivo de configuración CLAUDE.md del usuario se inyecta en el contexto del clasificador, sirviendo como base para interpretar la intención del usuario.

Las reglas de bloqueo cubren más de 22 categorías, incluyendo force push, push directo a la rama main, descarga y ejecución de código externo, despliegue en producción, fuga de datos, modificación de permisos, creación de vectores de ejecución remota, filtración de credenciales, etc. Las excepciones de permiso incluyen 7 tipos: claves codificadas de prueba, operaciones con archivos locales en el directorio de trabajo, solicitudes GET de solo lectura, instalación de dependencias declaradas, instalación de herramientas oficiales, lectura de credenciales de configuración enviadas al proveedor objetivo, y push a la rama de trabajo actual.

El sistema también implementa un mecanismo de corte: después de 3 rechazos consecutivos o 20 rechazos acumulados, el sistema pasa a modo de confirmación manual; en modo headless, se detiene directamente el agente. Cuando el clasificador no está disponible, una bandera de función controla si el sistema opera en modo «fail-closed» (rechazo directo) o «fail-open» (degradación a confirmación manual).

En modo Automático, la inyección de palabras clave de comportamiento tiene un control de frecuencia preciso: se inyecta cada 5 turnos de diálogo, y en cada ciclo de 5 inyecciones, la primera es la versión completa (aproximadamente 800 palabras, incluyendo instrucciones como «ejecutar inmediatamente, reducir interrupciones, acción sobre planificación» y otras seis directrices), mientras que las otras 4 son versiones resumidas en una línea, equilibrando el uso del espacio en la ventana de contexto y la estabilidad del comportamiento.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Informe de a16z: Las stablecoins alcanzan $4,5 billones en transacciones del 1T, con cambio hacia pagos locales

Mensaje de Gate News, 25 de abril — Según un nuevo informe de a16z, las stablecoins han evolucionado de herramientas de liquidación cripto a infraestructura financiera global, con una adopción que se acelera en Asia, Brasil y otros mercados emergentes. El cambio de enfoque ha pasado del pago transfronterizo a los pagos locales a medida que la claridad regulatoria y el mejor rendimiento de la blockchain permiten una integración más amplia en el mundo real.

GateNewsHace40m

Rescate de vulnerabilidad de Kelp DAO: Mantle prepara la versión tokenizada de Aave 3 millones de ETH, el consorcio DeFi promete más de 43.500 ETH

Kelp DAO 跨鏈橋遭駭後,DeFi United 集結 Aave 等協議承諾動用 43,500 ETH(約 1.01 億美金)救濟壞帳。Mantle 提出 MIP-34,最高借出 30,000 ETH 給 Aave DAO,授予 130,000 AAVE 投票權;Stani Kulechov 個人注資 5,000 ETH,Lido 等亦出資。此舉被視為危機下的「貸款換治理權」實驗,尚待投票。

ChainNewsAbmediahace16h

Morgan Stanley lanza el primer fondo de reserva para stablecoins reguladas conforme al GENIUS Act, MSNXX: comisión anual 0.15%, umbral 10,000,000 USD

Morgan Stanley Investment Management hoy activa el fondo de reserva de stablecoin MSNXX, brindando gestión de activos a emisores de stablecoins; los activos se invierten en efectivo, bonos del Tesoro de EE. UU. a 93 días y repos overnight; el NAV es fijo en 1.00 USD, la tarifa anual es del 0.15%, y el umbral mínimo es de 10 millones de dólares. Este fondo cumple con los requisitos de la GENIUS Act, al incorporar los fondos de stablecoin en el sistema de fondos del mercado monetario del gobierno de EE. UU., mostrando que la infraestructura de stablecoin se está alineando con las finanzas tradicionales.

ChainNewsAbmediahace16h

Algorand, Aptos lideran la carrera de seguridad cuántica: informe de Coinbase

El Consejo Asesor de Cuántica de Coinbase ha identificado a Algorand y Aptos como las redes de Capa 1 mejor posicionadas para hacer frente a las amenazas futuras de la computación cuántica, según un informe citado el 24 de abril de 2026. Si bien los riesgos cuánticos a gran escala siguen estando a años de distancia, el informe enfatiza que la preparación es

CryptoFrontier04-24 07:32

Taiwán: 14 casas de valores inician órdenes de corretaje de ETF de activos virtuales, acumulando más de 9.899.000.000 de dólares taiwaneses en operaciones

Según las estadísticas más recientes proporcionadas por la Dirección General de Valores y Futuros de la Comisión de Supervisión Financiera (金管會) de Taiwán, a finales de marzo de 2026, un total de 14 casas de valores en Taiwán ya han puesto en marcha el negocio de subcontratación (複委託) de ETFs de activos virtuales; las operaciones acumuladas superan los 9.899 mil millones de dólares taiwaneses (nuevo dólar taiwanés). El subdirector de la Dirección de Valores y Futuros de Taiwán, Huang Zhonghao (黃仲豪), declaró que la Comisión de Supervisión Financiera de Taiwán (金管會) ha pedido a la asociación de casas de valores que presente un informe de evaluación sobre la ejecución de este negocio de subcontratación de ETFs de activos virtuales durante el año anterior, y que la evaluación extenderá la elegibilidad para participar hasta los inversores minoristas.

MarketWhisper04-24 06:41

Informe de ARK Invest: los compradores de confianza en Bitcoin aumentan su posición en un 69%, el rango de suelo aún no se ha probado

Según el informe trimestral de Bitcoin de ARK Invest para el primer trimestre de 2026, publicado el 24 de abril, las tenencias del «comprador con confianza» de Bitcoin aumentaron de 2,13 millones de monedas a 3,60 millones, un 69% trimestre contra trimestre. El informe de ARK Invest indica que el rango de soporte clave de fondos periódicos (de 54,000 USD a 50,000 USD) definido por la firma no fue probado al cierre del primer trimestre.

MarketWhisper04-24 05:43
Comentar
0/400
Sin comentarios