Los filósofos se convierten en artículos codiciados en los laboratorios de IA, incorporando la ética en tu modelo.

Cuando le preguntas a Claude si deberías hacer algo, detrás hay alguien que ya ha pensado la respuesta de antemano, y esa persona podría ser un filósofo. Anthropic y OpenAI están forzando los marcos éticos de la deontología y el consecuencialismo en las reglas de comportamiento de la IA.
(Preámbulo: De salir de OpenAI a enfrentarse al Pentágono: Cómo el dúo de Anthropic trazó líneas rojas para la IA, evitando el colapso de la civilización)
(Contexto adicional: Juego de supervivencia de OpenRouter: Grok reina, los buenos hábitos de Claude se convierten en su talón de Aquiles)

Índice de este artículo

Toggle

  • Las dos filosofías detrás de las reglas
  • ¿Por qué filósofos?
  • Solo una fracción, y la postura no es necesariamente neutral

Pregúntale a Claude y a ChatGPT el mismo problema espinoso, y las respuestas pueden ser completamente diferentes. Esto no es un sesgo en los datos de entrenamiento ni ruido aleatorio, sino porque dos marcos filosóficos opuestos están siendo escritos por las empresas de IA en sus códigos de conducta. El modelo que usas es, en realidad, el producto de alguna postura ética.

Las dos filosofías detrás de las reglas

La "Constitución de la IA" (en lenguaje llano, el conjunto de reglas que restringen las respuestas y acciones del modelo) no es una estrategia de marketing de las startups, sino un intento de convertir la ética abstracta en instrucciones ejecutables por el sistema. El problema es que la ética misma tiene分歧 fundamentales.

Deontología (deontology, en pocas palabras: "hay cosas que nunca se deben hacer"): sin importar lo bueno que sea el resultado, mentir, coercionar, usar a las personas como herramientas son líneas rojas infranqueables.

Consecuencialismo (consequentialism, en pocas palabras: "hacer un balance general, si los beneficios superan los daños, se puede hacer"): mide costos y beneficios, y siempre que los beneficios esperados superen los riesgos previsibles, la acción es razonable.

El Claude de Anthropic tiende más hacia la línea deontológica, con un comportamiento más consistente y menos excepciones en diferentes contextos como el hogar o lugares públicos; ChatGPT y Google Gemini están más cerca del consecuencialismo, evaluando riesgos y beneficios caso por caso.

Esta diferencia no es accidental: el equipo que redactó la "Constitución" de Anthropic incluye explícitamente a los filósofos Amanda Askell y Joe Carlsmith, llevando la formación filosófica al núcleo de la alineación del modelo. Es una tensión real: ante la misma solicitud, un sistema deontológico puede rechazarla directamente, mientras que uno consecuencialista puede preguntar primero "¿en última instancia, a quién beneficia?"

¿Por qué filósofos?

Hace diez años, a los estudiantes de humanidades a menudo se les advertía "aprende a programar para tener futuro"; ahora son los ingenieros quienes se preocupan: ¿la IA hará obsoletas sus habilidades?

Anthropic, Google DeepMind y Meta han estado reclutando activamente investigadores en filosofía, ética y ciencia cognitiva en los últimos años, y esto no es solo una acción de relaciones públicas. La IA está abordando un conjunto de problemas sin una única solución técnica: conciencia, agencia, atribución de responsabilidad, gobernanza de seguridad, juicios de valor. Sam Altman declaró públicamente que OpenAI consultó a "cientos de filósofos morales" al establecer las reglas de ChatGPT. Independientemente de si la cifra es precisa, la dirección en sí misma ya indica el problema.

Anthropic y Google DeepMind incluso han ido más allá, invirtiendo en investigaciones sobre el "bienestar de la IA", explorando si los modelos tienen estados internos similares a los sentimientos. Esta investigación avanza en paralelo con la búsqueda de la AGI: si la IA realmente se acerca a una conciencia similar a la humana, la comprensión de los filósofos sobre la conciencia, el sujeto y el lenguaje no es solo un adorno humanístico, sino una perspectiva que los ingenieros no tienen.

En la comunidad de desarrolladores Hacker News, también hay observaciones constructivas: darle a la LLM el propósito, las razones y el contexto de las compensaciones produce resultados más fiables que las instrucciones puramente imperativas. Esto podría ser precisamente lo que la formación filosófica suele hacer: primero aclarar "qué problema se quiere resolver", luego preguntar "si a través de pruebas realmente cumple el propósito".

Por supuesto, también hay quienes contraargumentan que esto se parece más a una clarificación de requisitos del producto, no directamente equiparable a la argumentación rigurosa de la filosofía académica.

Solo una fracción, y la postura no es necesariamente neutral

Por supuesto, describir esta tendencia como "una gran invasión de filósofos en la industria tecnológica" es en sí mismo una exageración. En realidad, los puestos de filosofía siguen siendo escasos en toda la industria tecnológica, muy por debajo del 1% de los ingenieros.

Y el problema más fundamental no está en el número, sino en la estructura: ¿pueden los filósofos empleados realmente desafiar las decisiones comerciales de sus empleadores? Los equipos de ética de IA en las empresas tecnológicas tienen precedentes: cuando las conclusiones de la investigación entran en conflicto con los intereses comerciales, esos puestos suelen desaparecer primero.

Esto no es solo un problema de gobierno corporativo, sino que también involucra los riesgos del propio marco filosófico. El consecuencialismo suena racional y cuantificable, pero una vez aplicado al desarrollo de armas, decisiones políticas o sistemas a gran escala, la imprevisibilidad de las consecuencias hace que el cálculo de "los beneficios superan los daños" se descontrole rápidamente.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado