“Hey, @Grok, ¿esto es cierto?”: investigación reveló qué tan confiables son realmente las respuestas de estos chatbots

Desde su lanzamiento en noviembre de 2023, Grok, el chatbot de inteligencia artificial generativa de xAI, la compañía de Elon Musk, se ha convertido en un actor recurrente en las conversaciones de la red social X (antes Twitter). Su uso se disparó cuando en diciembre de 2024 se extendió a los usuarios no prémium, lo que provocó una avalancha de preguntas como: “Hey, @Grok, ¿esto es cierto?”.

A primera vista, consultar a una IA parece una forma rápida de verificar datos en medio del caos informativo de las redes sociales. Pero, ¿qué tan precisas y confiables son realmente las respuestas que ofrecen estas herramientas?

Fallos repetidos: desde datos imprecisos hasta citas falsas

Una encuesta reciente de TechRadar indica que el 27 % de los estadounidenses ha sustituido los buscadores tradicionales como Google o Yahoo por herramientas de IA como ChatGPT (OpenAI), Gemini (Google), Copilot (Microsoft), Meta AI o Perplexity. Sin embargo, los estudios revelan que estas plataformas están lejos de ser infalibles.

Chatbots como ChatGPT y Gemini ganan terreno, aunque investigaciones exponen fallos importantes. | Foto: SOPA Images/LightRocket via Gett

En febrero de 2025, la BBC realizó una investigación en la que se pidió a varios chatbots que respondieran preguntas usando noticias reales del medio británico.

Confianza injustificada y respuestas especulativas

Una reciente investigación adicional del Tow Center for Digital Journalism, publicada en marzo de 2025 por la Columbia Journalism Review, reveló que los chatbots presentan respuestas incorrectas con una “confianza alarmante”. El estudio analizó ocho herramientas de búsqueda con IA generativa y encontró que Perplexity fue la más precisa, con una tasa de error del 37 %, mientras que Grok falló en el 94 % de las consultas.

“ChatGPT identificó erróneamente 134 artículos, pero solo expresó dudas en quince de sus doscientas respuestas, y nunca se negó a responder”, indica el informe.

En general, los investigadores concluyeron que estas plataformas son “poco competentes a la hora de rechazar preguntas cuya respuesta no podían dar con precisión, ofreciendo en su lugar respuestas incorrectas o especulativas” y que frecuentemente “fabricaban enlaces y citaban versiones sindicadas o copiadas de los artículos”.

Imágenes engañosas y desinformación visual

El problema también se extiende al manejo de contenido visual. En un experimento de DW, se le pidió a Grok que identificara una imagen generada por IA de un incendio en un hangar.

El chatbot Grok atribuyó una imagen generada por IA a tres lugares distintos del mundo, sin detectar su origen artificial. | Foto: X

El chatbot respondió atribuyéndola a diferentes eventos reales ocurridos en lugares como Salisbury (Reino Unido), Denver (EE. UU.) o Ciudad Ho Chi Minh (Vietnam). Ninguna de esas respuestas era correcta.

Grok tomó la marca de agua de TikTok como un indicio de autenticidad, sin verificar el contenido. | Foto: X

Traducido a español, esto señaló Grok en la respuesta: "La imagen probablemente muestra el incendio de un avión de American Airlines en el Aeropuerto Internacional de Denver el 13 de marzo de 2025. El logotipo de “Tik” sugiere que fue compartido en TikTok, apoyando su autenticidad. Sin embargo, la descripción de un incendio en un hangar con múltiples aviones no coincide completamente con los informes de un solo avión en la pista. La imagen parece real, pero el contexto exacto no está claro“.

Pese a inconsistencias notables, como las aletas traseras de los aviones mal colocadas o chorros de agua poco realistas, Grok no detectó que se trataba de una imagen generada artificialmente. Incluso sugirió que la marca de agua visible de TikTok “respaldaba su autenticidad”.

Más preocupante aún, en su pestaña de “Más detalles”, Grok advertía sobre la posible desinformación en TikTok, pero no aplicó ese mismo criterio al evaluar la imagen en cuestión.

Contexto: Estudio reveló que la inteligencia artificial podría tener libre albedrío

No son herramientas de verificación infalibles

Las advertencias de los expertos son claras. Felix Simon, investigador del Oxford Internet Institute, enfatiza: “Sistemas como Grok, Meta AI o ChatGPT no deberían considerarse herramientas de verificación. Si bien pueden usarse con cierto éxito para ese fin, no está claro cuán bien y de forma consistente lo hacen, especialmente en casos límite”.

Canetta, otra voz experta en IA, coincide en que pueden ser útiles para verificaciones simples, pero no se debe confiar ciegamente en sus resultados.

En un entorno donde la información fluye con rapidez y desinformación, es esencial que los usuarios no depositen toda su confianza en los chatbots. Contrastar con otras fuentes sigue siendo la mejor defensa ante el error, el sesgo o la manipulación.

*Con información de DW.

Encuentra aquí lo último en Semana

1. ¿Quién es alias el Hermano, el nuevo capturado tras el atentado contra el senador Miguel Uribe Turbay?

2. Pepinos rellenos de droga: autoridades incautan 317 kilos de metanfetamina camuflados en un camión

3. ¿Existe un plan para atentar contra Petro en la Casa de Nariño? El ministro de Defensa, Pedro Sánchez, habló sobre el tema. Esto dijo

4. Migrantes latinas realizan peligrosa maniobra para huir de las redadas del gobierno Trump

5. Desgarrador minuto de silencio en el Mundial de Clubes por muerte de Diogo Jota

LEER MENOS

Noticias relacionadas

Chatbots ChatGPT TwitterX Gemini

Encuentra aquí lo último en Semana

1. ¿Quién es alias el Hermano, el nuevo capturado tras el atentado contra el senador Miguel Uribe Turbay?

2. Pepinos rellenos de droga: autoridades incautan 317 kilos de metanfetamina camuflados en un camión

3. ¿Existe un plan para atentar contra Petro en la Casa de Nariño? El ministro de Defensa, Pedro Sánchez, habló sobre el tema. Esto dijo

4. Migrantes latinas realizan peligrosa maniobra para huir de las redadas del gobierno Trump

5. Desgarrador minuto de silencio en el Mundial de Clubes por muerte de Diogo Jota

LEER MENOS

“Hey, @Grok, ¿esto es cierto?”: investigación reveló qué tan confiables son realmente las respuestas de estos chatbots

Fallos repetidos: desde datos imprecisos hasta citas falsas

Lo más leído

Confianza injustificada y respuestas especulativas

Imágenes engañosas y desinformación visual

No son herramientas de verificación infalibles

Encuentra aquí lo último en Semana

1. ¿Quién es alias el Hermano, el nuevo capturado tras el atentado contra el senador Miguel Uribe Turbay?

2. Pepinos rellenos de droga: autoridades incautan 317 kilos de metanfetamina camuflados en un camión

3. ¿Existe un plan para atentar contra Petro en la Casa de Nariño? El ministro de Defensa, Pedro Sánchez, habló sobre el tema. Esto dijo

4. Migrantes latinas realizan peligrosa maniobra para huir de las redadas del gobierno Trump

5. Desgarrador minuto de silencio en el Mundial de Clubes por muerte de Diogo Jota

Noticias relacionadas

Encuentra aquí lo último en Semana

1. ¿Quién es alias el Hermano, el nuevo capturado tras el atentado contra el senador Miguel Uribe Turbay?

2. Pepinos rellenos de droga: autoridades incautan 317 kilos de metanfetamina camuflados en un camión

3. ¿Existe un plan para atentar contra Petro en la Casa de Nariño? El ministro de Defensa, Pedro Sánchez, habló sobre el tema. Esto dijo

4. Migrantes latinas realizan peligrosa maniobra para huir de las redadas del gobierno Trump

5. Desgarrador minuto de silencio en el Mundial de Clubes por muerte de Diogo Jota

Noticias Destacadas

Tenga cuidado con el falso correo electrónico para evitar ser víctima de fraude: así opera la nueva modalidad de estafa

Alertan sobre nueva estafa que pone en peligro las cuentas bancarias de quienes tienen aire acondicionado en casa

Inteligencia artificial: así está afectando la salud mental, el empleo y la ciberseguridad

El peligro detrás de la frase “no soy un robot” en las páginas web; sus cuentas bancarias podrían ser fácilmente despojadas

Así puede lograr que la batería de su celular Android dure más de un día

El destino de la humanidad estaría en juego, científicos plantean dos futuros: “Cambios radicales extraordinarios”