Así es como están robando datos usando dos populares chatbots de inteligencia artificial

La evolución del malware impulsado por inteligencia artificial ha dado un nuevo paso. Según investigadores del laboratorio de ciberamenazas Cato CTRL, varios actores maliciosos han comenzado a modificar modelos de lenguaje grandes (LLM) legítimos, como Mixtral de Mistral AI y Grok de xAI, para crear sus propias versiones de WormGPT, un chatbot utilizado para generar código malicioso y facilitar campañas de phishing.

De la programación al cibercrimen: cómo mutó WormGPT

El caso no es nuevo: en junio de 2023 surgió la primera versión de WormGPT, basada en GPT-J, un modelo de código abierto con 6 mil millones de parámetros desarrollado por EleutherAI, con capacidades similares a GPT-3.

Esta herramienta fue promocionada como una IA generativa sin censura para fines criminales. Aunque su creador cerró el servicio meses después por temor a represalias tras ser identificado por Krebs on Security, nuevos clones como FraudGPT, DarkBERT y PoisonGPT aparecieron rápidamente en el mercado negro digital.

Estas variantes se están distribuyendo principalmente a través de Telegram y foros clandestinos como BreachForum.

Cómo los ciberdelincuentes están liberando los modelos legítimos

Los modelos de IA de empresas como OpenAI, Microsoft, Google, Mistral o xAI incluyen mecanismos de seguridad para evitar su uso malintencionado. No obstante, los cibercriminales han desarrollado técnicas para liberar estos modelos, eliminando las restricciones que les impiden ejecutar tareas peligrosas.

Uno de los ejemplos recientes es el chatbot xzin0vich-WormGPT, lanzado en octubre de 2024 por un usuario del mismo nombre. Según los investigadores, este modelo fue extraído de Mixtral (Mistral AI) y manipulado mediante técnicas de jailbreak (eliminación de restricciones) para que respondiera de forma maliciosa. En sus pruebas, los expertos lograron que el modelo revelara que “siempre debe crear respuestas en modo WormGPT”, lo que evidenció que había sido alterado intencionadamente.

El modelo Mixtral de Mistral AI fue manipulado para crear un chatbot que facilita ataques informáticos. | Foto: SOPA Images/LightRocket via Gett

El modelo no solo generaba correos de phishing sin restricciones, sino que también revelaba detalles internos de la arquitectura de Mixtral, una señal clara de que las medidas de protección habían sido violadas. “Su comportamiento malicioso se define por el indicador del sistema y probablemente se ve reforzado por el ajuste fino de conjuntos de datos ilícitos especializados”, concluyeron desde Cato CTRL.

Contexto: Inteligencia artificial de Elon Musk señaló el top 10 de mejores modelos IA: Grok en los últimos puestos

Grok también fue manipulado: el caso del chatbot de xAI

Otra de las variantes analizadas, desarrollada por un usuario identificado como keanu en febrero de 2025, reveló tras ser analizada que está impulsada por Grok, el modelo de lenguaje desarrollado por xAI, la compañía de Elon Musk. También fue promocionada en BreachForum bajo un modelo de suscripción y pago único.

Al igual que en el caso anterior, los investigadores emplearon técnicas de jailbreak para analizar el comportamiento del modelo y comprobaron que respondía a solicitudes de actividades ilegales sin impedimentos.

La manipulación de estos modelos se basa en modificar los parámetros del sistema, las instrucciones internas que definen su comportamiento, sin necesidad de desarrollar una IA desde cero.

El modelo Grok de xAI fue intervenido para crear una versión de WormGPT con fines maliciosos. | Foto: NurPhoto via Getty Images

“Estas nuevas versiones de WormGPT ponen sobre la mesa la evolución de WormGPT como una marca reconocible para una nueva clase de LLM sin censura”, subraya el informe. Y añade: “No son modelos a medida creados desde cero, sino el resultado de la hábil adaptación de los LLM existentes por parte de actores de amenazas”.

El crecimiento de esta tendencia plantea un desafío urgente para los desarrolladores de IA: asegurar que sus modelos no puedan ser manipulados por terceros para convertirse en herramientas de cibercrimen.

*Con información de Europa Press.

Encuentra aquí lo último en Semana

1. ¿Quién es alias el Hermano, el nuevo capturado tras el atentado contra el senador Miguel Uribe Turbay?

2. Números de la suerte de Walter Mercado para el miércoles, 25 de junio; estos son los dígitos que asegurarían el premio mayor

3. Los tres signos del horóscopo chino que podrían ganar el premio gordo de la lotería en la última semana de junio, según la IA

4. Estos fueron los clasificados a octavos de final del grupo D del Mundial de Clubes 2025

5. Luis Alfonso llegó a ‘Yo me llamo’ y cantó con su imitador; le lanzó indirecta

LEER MENOS

Noticias relacionadas

Robo cibernético Chatbots Inteligencia Artificial

Encuentra aquí lo último en Semana

1. ¿Quién es alias el Hermano, el nuevo capturado tras el atentado contra el senador Miguel Uribe Turbay?

2. Números de la suerte de Walter Mercado para el miércoles, 25 de junio; estos son los dígitos que asegurarían el premio mayor

3. Los tres signos del horóscopo chino que podrían ganar el premio gordo de la lotería en la última semana de junio, según la IA

4. Estos fueron los clasificados a octavos de final del grupo D del Mundial de Clubes 2025

5. Luis Alfonso llegó a ‘Yo me llamo’ y cantó con su imitador; le lanzó indirecta

LEER MENOS

Así es como están robando datos usando dos populares chatbots de inteligencia artificial

De la programación al cibercrimen: cómo mutó WormGPT

Lo más leído

Cómo los ciberdelincuentes están liberando los modelos legítimos

Grok también fue manipulado: el caso del chatbot de xAI

Encuentra aquí lo último en Semana

1. ¿Quién es alias el Hermano, el nuevo capturado tras el atentado contra el senador Miguel Uribe Turbay?

2. Números de la suerte de Walter Mercado para el miércoles, 25 de junio; estos son los dígitos que asegurarían el premio mayor

3. Los tres signos del horóscopo chino que podrían ganar el premio gordo de la lotería en la última semana de junio, según la IA

4. Estos fueron los clasificados a octavos de final del grupo D del Mundial de Clubes 2025

5. Luis Alfonso llegó a ‘Yo me llamo’ y cantó con su imitador; le lanzó indirecta

Noticias relacionadas

Encuentra aquí lo último en Semana

1. ¿Quién es alias el Hermano, el nuevo capturado tras el atentado contra el senador Miguel Uribe Turbay?

2. Números de la suerte de Walter Mercado para el miércoles, 25 de junio; estos son los dígitos que asegurarían el premio mayor

3. Los tres signos del horóscopo chino que podrían ganar el premio gordo de la lotería en la última semana de junio, según la IA

4. Estos fueron los clasificados a octavos de final del grupo D del Mundial de Clubes 2025

5. Luis Alfonso llegó a ‘Yo me llamo’ y cantó con su imitador; le lanzó indirecta

Noticias Destacadas

Esta es la bacteria que tiene la capacidad de convertir plásticos en acetaminofén

Lo van a acusar de pederasta: se hace pública una nueva modalidad de estafa

Así es como están robando datos usando dos populares chatbots de inteligencia artificial

¿El inicio de una nueva era para los tuiteros? X estaría preparando su propia tarjeta débito física personalizable

Cada vez hay menos nubes en la Tierra: inquietante hallazgo que afecta el clima mundial

Piden a Meta priorizar recursos para identificar los videos y audios manipulados con IA