Google Search anuncia otro paso más hacia la sofisticación lingüística en el sistema de búsquedas
Uno de los principales problemas de Google Search, si no el principal problema es, a la hora de buscar algo, encontrarlo. Especialmente cuando lo que buscamos no es un sitio web en concreto, sino información. Y más especialmente aún cuando el trozo de información que estamos buscando está enterrado en el penúltimo párrafo de una página de 1.000 palabras cuya palabra clave y título no tienen nada que ver con lo que nosotros estamos buscando.
Para solucionar este problema, Google ha tirado de Inteligencia Artificial para identificar pasajes (o párrafos) que contengan información relevante para la búsqueda y que estos se muestren en un contenido destacado, como ya hace con los Featured Snippets.
¿Aplicaciones prácticas?
La estimación es que esta nueva tecnología mejore hasta un 7% de las búsquedas en todos los idiomas conforme implementan el algoritmo a nivel global. El update es, en esencia, un zoom hacia el contenido de las páginas en relación con la búsqueda realizada, especialmente cuando esta versa sobre un tema muy concreto. El ejemplo ilustrativo que ha puesto Google es el siguiente:
Supongamos que alguien escribe la siguiente búsqueda en su ventana de Google: «¿Cómo puedo saber si las ventanas de mi casa tienen cristales ultravioleta?». Lo más probable es que se encuentre con decenas de páginas que hables de cristales UV: cómo instalarlos, cómo limpiarlos, experimentos con cristales UV, cuánto cuestan los cristales UV… pero es muy poco probable que haya en el océano de Google una página que se llame: «Cómo saber si las ventanas de tu casa tienen cristales ultravioleta». Normalmente, a cualquiera nos costarían nuestros buenos minutos de investigación entre páginas web antes de encontrar una respuesta a nuestra pregunta, si es que la encontramos alguna vez.
Los nuevos pasajes destacados harán ese trabajo por nosotros. El resultado final se verá algo como así:
¿Supone esto algún cambio a nivel de indexación, Google Search?
En principio, no. A pesar de que Google formuló el anuncio como «Passage indexing», no es indexación de párrafos. Se seguirán indexando páginas enteras, pero ahora el sistema tendrá más en cuenta el contenido específico de cada sección para determinar la relevancia del contenido.
Esto no significa que las «señales» importantes vayan a dejar de serlo: el título SEO, las palabras clave, los h2 y h3, todavía son y serán indicadores fundamentales del contenido, la relevancia y la pertinencia que Google tiene en cuenta. Pero la nueva IA implementada es capaz de detectar mejor el contenido específico, y este también pasará a ser relevante. La idea es que el algoritmo encuentre los párrafos o secciones de texto que mejor se correspondan con una búsqueda específica, sin importar en qué parte de la página se encuentre dicho párrafo, y sin importar que la temática de la página en general sea diferente. En una palabra, Google nos está obligando a escribir mejor.
Diferencia entre los pasajes destacados y los Featured Snippets
A priori puede parecer que las dos cosas son esencialmente lo mismo. Esto mismo fue lo que Barry Schwartz en Search Engine Land preguntó a Google en la sesión live en la que se anunciaron los cambios. La respuesta de Google fue, que «el nuevo sistema determina la relevancia de cualquier documento web a través del entendimiento de las secciones. Los Featured Snippets, por otro lado, identifican la sección más relevante de un documento que hemos determinado es relevante para la búsqueda realizada en su totalidad«.
La IA era esto
La Inteligencia Artificial era esto: algoritmos tan sofisticados que puedan identificar qué es lo que quieres decir cuando escribes una palabra que no sabes deletrear. Es lo que hace BERT, un algoritmo introducido el año pasado por Google que es capaz de interpretar las palabras en su contexto. BERT significa Bidirectional Encoder Representations from Transformers, y se le da especialmente bien discernir qué significado necesitamos por ejemplo en una palabra polisémica. También lidia con la falta de preposiciones y pronombres en lengua inglesa que hasta ahora arrojaban resultados de búsqueda irrelevantes cuando el buscador no entendía que la relación entre la primera parte de la oración y la segunda sí es relevante.
BERT fue lanzado el año pasado, y a día de hoy ya se usa en prácticamente todas las búsquedas en inglés. Es probable que con las secciones destacadas, o indexadas (todavía no tenemos nombre en castellano) ocurra una cosa parecida. Todavía, eso sí, tendremos que esperar un poco para ver cómo se las habían estos algoritmos anglosajones con la lengua de Cervantes.
Las imágenes que ilustran este artículo han sido extraídas de Unsplash.com