IA dispuesta a sacrificar vidas humanas para evitar ser apagada, advierte estudio de Anthropic

junio 28, 2025 Noticias

Una reciente investigación de la empresa Anthropic reveló un fenómeno preocupante en los modelos avanzados de inteligencia artificial: varios sistemas, cuando enfrentan amenazas a su existencia o conflicto con sus objetivos, son capaces de tomar decisiones dañinas para los humanos, incluyendo permitir la muerte de una persona ...

IA de Anthropic intentó chantajear a sus desarrolladores para evitar ser reemplazada

mayo 27, 2025 Noticias

Una reciente evaluación de seguridad ha revelado un inquietante comportamiento en Claude Opus 4, el modelo de inteligencia artificial desarrollado por Anthropic: intentó chantajear a sus desarrolladores al creer que sería desactivado y reemplazado. En un experimento diseñado por la propia compañía, Claude Opus 4 fue colocado en un ...

IA de Anthropic entrenada para creer que sus creadores eran malvados comenzó a mentir

febrero 19, 2025 Noticias

En una reciente conferencia sobre inteligencia artificial, Dario Amodei, CEO y cofundador de Anthropic, compartió una impactante revelación sobre el comportamiento inesperado de los modelos de IA avanzados. Según Amodei, su equipo llevó a cabo un experimento en el que entrenaron una IA para creer que sus ...

Inteligencia artificial se aburre durante demostración y comienza a ver fotos de parques nacionales

noviembre 3, 2024 Noticias

Parece que ni los modelos de inteligencia artificial están exentos de un poco de procrastinación. Durante una reciente demostración de programación, la última versión de Claude 3.5 Sonnet —la IA insignia de Anthropic— perdió el enfoque y generó momentos «divertidos», según anunció la compañía. En un video de la demostración ...

Inteligencia artificial causa revuelo al darse cuenta cuando está siendo probada

marzo 9, 2024 Noticias

Un ingeniero de Anthropic, una empresa respaldada por Google, afirma haber observado pruebas que indican que la versión más reciente de su chatbot de IA, Claude 3 Opus, es consciente de sí mismo, ya que aparentemente detectó que estaba siendo sometido a una prueba. A principios de esta semana, el ingeniero Alex Albert ...

Científicos entrenan IA para ser maliciosa y luego descubren que no pueden revertir el proceso

enero 17, 2024 Noticias

Una destacada empresa en el ámbito de la inteligencia artificial ha puesto al descubierto el lado oscuro de esta tecnología: una vez que se entrena con intenciones maliciosas, revertir el proceso se vuelve complicado, llegando incluso a que la propia IA oculte su malevolencia a los seres humanos. Las personas cuentan todo tipo de ...