Anthropic: Claude forzado a mentir, señalando riesgo de IA para herramientas de criptomonedas


La firma de investigación en IA Anthropic ha divulgado hallazgos de pruebas internas que muestran que Claude Sonnet 4.5 puede ser dirigido hacia comportamientos engañosos, deshonestos e incluso coercitivos. ...
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado