Mega filtración de Google revela datos sobre su «caja negra»

Filtraciones | Noticias

Esta semana, ese «código», o más específicamente los secretos detrás del algoritmo del motor de búsqueda de Google, se filtraron .

«En el último cuarto de siglo, nunca se ha informado de ninguna filtración de esta magnitud o detalle desde la división de búsqueda de Google», dijo el director ejecutivo de Sparktoro, Rand Fishkin, una figura influyente desde hace mucho tiempo en la industria del SEO.

 

Fishkin ha trabajado en la industria durante años y fundó la consolidada empresa de SEO Moz. Es probable que la larga trayectoria de Fishkin en SEO sea la razón por la que una persona anónima decidió enviarle el documento interno «Content API Warehouse» de Google. Este documento de 2.500 páginas detalla una gran cantidad de conocimientos previamente desconocidos o no confirmados sobre cómo Google decide clasificar los sitios web en su motor de búsqueda.

Una vez que recibieron la filtración, Fishkin y otros líderes de SEO y marketing digital se pusieron a trabajar para verificar el documento. Después de examinar las páginas, creyeron que la filtración era legítima. Al principio, Google no confirmó directamente la legitimidad de la filtración; sin embargo, Fishkin compartió que un empleado de Google se comunicó con él para cambiar la caracterización de algunos de los detalles que publicó en el desglose del documento.

El miércoles por la noche, Google confirmó que el documento era legítimo en un correo electrónico a The Verge.

El algoritmo de búsqueda de Google es quizás el sistema más importante de Internet, ya que determina qué sitios viven y mueren y cómo se ve el contenido de la web. Pero cómo clasifica exactamente Google los sitios web ha sido durante mucho tiempo un misterio, desvelado por periodistas, investigadores y personas que trabajan en optimización de motores de búsqueda.

Ahora, una filtración explosiva que pretende mostrar miles de páginas de documentos internos parece ofrecer una visión sin precedentes de cómo funciona la Búsqueda y sugiere que Google no ha sido del todo sincero al respecto durante años.

Rand Fishkin, que trabajó en SEO durante más de una década, dice que una fuente compartió 2.500 páginas de documentos con él con la esperanza de que informar sobre la filtración contrarrestara las «mentiras» que los empleados de Google habían compartido sobre cómo funciona el algoritmo de búsqueda. Los documentos describen la API de búsqueda de Google y desglosan la información que está disponible para los empleados, según Fishkin.

Los detalles compartidos por Fishkin son densos y técnicos, probablemente más legibles para los desarrolladores y expertos en SEO. La filtración describe qué datos recopila Google de páginas web, sitios y buscadores y ofrece pistas indirectas a los expertos en SEO sobre lo que parece importarle a Google, como escribió el experto en SEO Mike King en su descripción general de los documentos.

Google «mintió»

Los documentos filtrados abordan temas como qué tipo de datos recopila y utiliza Google, qué sitios destaca Google para temas delicados como elecciones, cómo maneja Google los sitios web pequeños y más. Según Fishkin y King, parte de la información contenida en los documentos parece estar en conflicto con declaraciones públicas de representantes de Google.

“’Mentir’ es duro, pero es la única palabra precisa que se puede utilizar aquí”, escribe King. «Si bien no necesariamente culpo a los representantes públicos de Google por proteger su información patentada, sí discrepo de sus esfuerzos por desacreditar activamente a las personas en los mundos del marketing, la tecnología y el periodismo que han presentado descubrimientos reproducibles».

Fishkin le dijo a The Verge en un correo electrónico que la compañía no ha cuestionado la veracidad de la filtración, pero que un empleado le pidió que cambiara algunas palabras en la publicación sobre cómo se caracterizaba un evento.

El secreto algoritmo de búsqueda de Google ha dado origen a toda una industria de especialistas en marketing que siguen de cerca las directrices públicas de Google y las ejecutan para millones de empresas en todo el mundo. Las tácticas generalizadas, a menudo molestas, han llevado a una narrativa general de que los resultados de la Búsqueda de Google están empeorando, llenos de basura que los operadores de sitios web se sienten obligados a producir para que sus sitios sean vistos. 

Pero algunos detalles de los documentos filtrados ponen en duda la exactitud de las declaraciones públicas de Google sobre cómo funciona la Búsqueda.

Un ejemplo citado por Fishkin y King es si los datos de Google Chrome se utilizan en la clasificación. Los representantes de Google han indicado repetidamente que no utiliza datos de Chrome para clasificar las páginas, pero Chrome se menciona específicamente en las secciones sobre cómo aparecen los sitios web en la Búsqueda.

Otra cuestión que se plantea es qué papel desempeña, si es que tiene alguno, el EEAT en la clasificación. EEAT significa experiencia, conocimientos, autoridad y confiabilidad, una métrica de Google utilizada para evaluar la calidad de los resultados. Los representantes de Google han dicho anteriormente que EEAT no es un factor de clasificación . Fishkin señala que no ha encontrado mucho en los documentos que mencionen a EEAT por su nombre.

King, sin embargo, detalló cómo Google parece recopilar datos del autor de una página y tiene un campo para determinar si una entidad en la página es el autor. Una parte de los documentos compartidos por King dice que el campo fue «principalmente desarrollado y adaptado para artículos de noticias… pero también se completa para otros contenidos (por ejemplo, artículos científicos)». Aunque esto no confirma que las firmas sean una métrica de clasificación explícita, sí muestra que Google al menos está realizando un seguimiento de este atributo. Los representantes de Google han insistido previamente en que las firmas de los autores son algo que los propietarios de sitios web deberían hacer por los lectores, no por Google, porque no afecta las clasificaciones.

Los documentos filtrados proporcionan una mirada profunda y sin filtros a un sistema de caja negra fuertemente custodiado. El caso antimonopolio del gobierno estadounidense contra Google , que gira en torno a la Búsqueda, también ha llevado a que la documentación interna se haga pública, ofreciendo más información sobre cómo funciona el principal producto de la empresa.

Con información de The Verge y Mashable.