Tecnología

Filtran masivamente documentos internos que expondrían cómo funciona el algoritmo de Google

Surge una nueva controversia en torno a las búsquedas en Google.

Siga de cerca las tendencias en tecnología y ciencia en Discover

29 de mayo de 2024, 6:08 p. m.

Google impone sanciones contra Rusia. (Photo by Nicolas Economou/NurPhoto via Getty Images). Foto: NurPhoto via Getty Images

Google ha sido el objetivo de una filtración masiva en la que se han revelado más de 2.500 páginas de documentos que explican cómo funciona realmente el algoritmo de su motor de búsqueda y que sugieren que las declaraciones públicas que la compañía ha hecho sobre su actividad son erróneas.

La compañía ha comentado en diferentes ocasiones cómo trabaja el algoritmo de su buscador y el modo en que pretende ofrecer el mejor resultado posible, a fin de cumplir con su política de transparencia con los usuarios.

También han sido varias las veces en las que ha indicado que una de sus máximas es la de acabar con la desinformación y el contenido spam, motivo por el que actualiza con frecuencia tanto su algoritmo como sus políticas y sistemas automatizados para neutralizar “tácticas emergentes” con las que los actores maliciosos buscan “engañar” sus resultados con contenido de baja calidad.

El polémico truco de Google para descubrir en segundos la ubicación exacta de una persona y sin que ella lo sepa

El cofundador de la herramienta de inteligencia SparkToro y que durante años ha trabajado en SEO, Rand Fishkin, ha publicado recientemente un artículo en el que afirma haber tenido acceso a una serie de documentos relacionados con la interfaz de programación (API) del motor de búsqueda de Google, que recogen una explicación contraria a la que la compañía habría afirmado en otras ocasiones en relación con el funcionamiento de su algoritmo.

Tecnología

Sora, la ‘app’ para generar videos con IA, sufre caída en descargas, ¿por qué?

Tecnología

Red social X implementa novedad con las notas colaborativas, ¿de qué se trata?

Tecnología

Medir el tiempo sin usar relojes: el avance cuántico que sorprende a los físicos

Tecnología

Si está cansado de las llamadas spam, este es el nuevo prefijo que le permitiría identificarlas antes de contestar

Estados Unidos

“Qué miserable sería nuestra existencia”, el gobernador de Florida, Ron DeSantis, arremetió contra la IA y gigantes tecnológicos

Tecnología

Prepárese: Netflix dejará de funcionar en esta popular consola PlayStation a partir de la siguiente fecha

Tecnología

Meta prepara una aplicación independiente de Vibes para crear y compartir videos generados por IA

Tecnología

El ambicioso plan de Elon Musk para sostener el crecimiento de la inteligencia artificial: “Ocurrirá en 36 meses o menos”

Tecnología

Gemini supera los 750 millones de usuarios activos mensuales; estas son sus apuestas para los próximos meses

Vehículos

Waymo prepara despliegue de taxis autónomos a “una velocidad sin precedentes”: estas son las ciudades a donde llegará el servicio

A medida que los AI Overview de Google continúan generando controversia, surge la pregunta inevitable: ¿está fallando esta nueva incursión de Google en la búsqueda inteligente?

Los usuarios se han visto divididos ante la promesa inicial de los AI Overview de Google y su desempeño real en la entrega de resultados precisos y confiables. Foto: NurPhoto via Getty Images

Más concretamente, Fishkin señaló que el pasado 5 de mayo recibió un correo electrónico en el que una persona afirmaba tener acceso a una filtración masiva cuya autenticidad había sido verificada por extrabajadores de Google y que tanto estos como otras personas habían compartido información privada adicional sobre las operaciones de búsqueda de Google.

Comentó que muchas de las afirmaciones incluidas en estos archivos “contradicen directamente las declaraciones públicas realizadas por los empleados de Google a lo largo de los años”, tal y como ha compartido en el blog de SparkToro.

Google I/O 2024: ¿Qué novedades recibió Gemini y por qué ChatGPT debería estar asustado?

El experto en SEO señaló que lo descubierto en estos documentos “es solo la punta del iceberg” e insistió en que “las afirmaciones extraordinarias requieren pruebas extraordinarias”. De ahí que haya tomado como válida la aportación del también experto en SEO y fundador de EA Eagle Digital, Erfan Azimi, una persona relacionada con el sector del marketing que le mostró la filtración en sí.

En concreto, aportó más de 2.500 páginas de documentos relacionadas con la API y 14.014 atributos de la interfaz que parecen proceder del denominado Almacén de API de contenido interno de Google.

Si bien estos documentos no aportan detalles sobre, por ejemplo, cómo se utilizan los sistemas de clasificación en la búsqueda, sí dan información sobre los datos que recopila la compañía.

Durante su investigación y para asegurar la fiabilidad de esta filtración, Fishkin se puso en contacto con el fundador de iPullRank, Mike King, que considera “uno de los SEO técnicos más destacados del mundo”. Este determinó que los documentos parecían legítimos dentro de la división de Búsqueda de Google y que contenían una cantidad extraordinaria de información no confirmada previamente sobre el funcionamiento interno de Google.

El edificio de Google en Nueva York, el 26 de febrero de 2024. Foto: AP

Tras su revisión, una de las conclusiones a las que ha llegado Fishkin es que la filtración parece provenir de GitHub y que durante marzo y mayo de este año estos archivos de la API se difundieron en Hexdocs, que indexa los repositorios públicos de este portal y circuló a través de otras fuentes.

En cuanto a la temporalidad de los documentos, reconoció que en ellos se hace referencia a funciones obsoletas, ya que la búsqueda de Google cambia “enormemente de un año al otro” y que en ellos no se hace mención de las descripciones generales de inteligencia artificial (IA) más actuales.

Chrome recibe nuevas funciones para iPhone, que harán más segura la búsqueda en internet. Foto: Google

Asimismo, asumió que estos archivos reflejan una cantidad de información “demasiado grande y demasiado densa”, lo que justifica que, por el momento, solo haya podido compartir cinco descubrimientos “que arrojan luz sobre cosas que durante mucho tiempo se supuso que Google estaba haciendo y otros que sugieren que las declaraciones públicas de la compañía han sido erróneas”.

Google planea implementar una función de bloqueo remoto.

Google prepara una función que le dará problemas a los ‘chismosos’ que les gusta revisar el celular ajeno

Cinco descubrimientos clave

En primer lugar, el investigador indicó que Google parece tener diferentes formas de filtrar los clics que no quiere registrar en sus sistemas de clasificación y que incluye solo los que le interesan. Asimismo, miden la duración de los clics y las impresiones

Por otra parte, añadió que los documentos de la API sugieren que Google dispone de una lista de las URL principales y que usa la cantidad de clics en las páginas de Chrome para determinar cuáles son las más populares.

En tercer lugar, los documentos sugieren que Google introduce determinados dominios relacionados con “consultas muy controvertidas o potencialmente peligrosas” en búsquedas relacionadas con viajes y política. Esto ofrece resultados que favorecen la información sesgada.

La filtración también reveló que existen evidencias de que las puntuaciones y los datos generados por algunos evaluadores de la plataforma EWOK, que miden la calidad de los sitios web, pueden estar directamente involucrados con el sistema de búsqueda de Google, “en lugar de ser simplemente un conjunto de entrenamiento para experimentos”.

Finalmente, parte de estos documentos revisados concluyen que Google utiliza datos de los clics para determinar cómo ponderar los enlaces en las clasificaciones (de calidad baja, media o alta). De esta manera, si uno de ellos no registra clics, ingresa en el índice de baja calidad y se ignora. Por el contrario, si tiene un gran volumen de clics desde dispositivos verificables, se clasifica como enlace de alta calidad.

¿Qué dice Google sobre la filtración?

Ante la filtración explosiva que pretende mostrar miles de páginas de documentos internos sobre cómo funciona el sistema de búsqueda Google, además de plantear que la compañía no habría sido del todo sincera al respecto durante años.

Hasta el momento, Google no ha respondido a múltiples solicitudes de comentarios sobre la legitimidad de los documentos.

The Verge, medio especializado, señala que la compañía no ha dado una respuesta a sus solicitudes de comentarios sobre los documentos, incluyendo una petición directa para conocer si la marca refuta la legitimidad de la documentación.

*Con información de Europa Press.

VER MÁS

Google buscador Páginas web algoritmos

Filtran masivamente documentos internos que expondrían cómo funciona el algoritmo de Google

Cinco descubrimientos clave

¿Qué dice Google sobre la filtración?

VER MÁS

Más de Tecnología

Sora, la ‘app’ para generar videos con IA, sufre caída en descargas, ¿por qué?

Sora, la ‘app’ para generar videos con IA, sufre caída en descargas, ¿por qué?

Red social X implementa novedad con las notas colaborativas, ¿de qué se trata?

Red social X implementa novedad con las notas colaborativas, ¿de qué se trata?

Medir el tiempo sin usar relojes: el avance cuántico que sorprende a los físicos

Medir el tiempo sin usar relojes: el avance cuántico que sorprende a los físicos

Si está cansado de las llamadas spam, este es el nuevo prefijo que le permitiría identificarlas antes de contestar

Si está cansado de las llamadas spam, este es el nuevo prefijo que le permitiría identificarlas antes de contestar

“Qué miserable sería nuestra existencia”, el gobernador de Florida, Ron DeSantis, arremetió contra la IA y gigantes tecnológicos

“Qué miserable sería nuestra existencia”, el gobernador de Florida, Ron DeSantis, arremetió contra la IA y gigantes tecnológicos

Prepárese: Netflix dejará de funcionar en esta popular consola PlayStation a partir de la siguiente fecha

Prepárese: Netflix dejará de funcionar en esta popular consola PlayStation a partir de la siguiente fecha

Meta prepara una aplicación independiente de Vibes para crear y compartir videos generados por IA

Meta prepara una aplicación independiente de Vibes para crear y compartir videos generados por IA

El ambicioso plan de Elon Musk para sostener el crecimiento de la inteligencia artificial: “Ocurrirá en 36 meses o menos”

El ambicioso plan de Elon Musk para sostener el crecimiento de la inteligencia artificial: “Ocurrirá en 36 meses o menos”

Xbox se alista para presentar su nueva generación de consolas: gráficos mejorados y jugabilidad híbrida estarían en camino

Xbox se alista para presentar su nueva generación de consolas: gráficos mejorados y jugabilidad híbrida estarían en camino

Científicos advierten y llaman a estos países a prepararse para un eclipse solar inédito que iluminará el cielo dentro de poco

Científicos advierten y llaman a estos países a prepararse para un eclipse solar inédito que iluminará el cielo dentro de poco

Noticias Destacadas

Sora, la ‘app’ para generar videos con IA, sufre caída en descargas, ¿por qué?

Red social X implementa novedad con las notas colaborativas, ¿de qué se trata?

Medir el tiempo sin usar relojes: el avance cuántico que sorprende a los físicos

Si está cansado de las llamadas spam, este es el nuevo prefijo que le permitiría identificarlas antes de contestar

“Qué miserable sería nuestra existencia”, el gobernador de Florida, Ron DeSantis, arremetió contra la IA y gigantes tecnológicos

Prepárese: Netflix dejará de funcionar en esta popular consola PlayStation a partir de la siguiente fecha