Publicado en Matemáticas de la vida cotidiana

Ejercicio 5. Artículo: Historia de Google y su algoritmo Pagerank

Como me pasaba con otra asignatura de este máster, la de Inteligencia Artificial, me cuesta bastante seguir el desarrollo matemático que llevan todas las aplicaciones informáticas. Y eso que, en su momento, no tenía excesivos problemas con el cálculo de matrices, allá por el antiguo COU (actual 2º Bachillerato), pero, claro, estamos hablando del siglo pasado, y son muchos años sin haber usado esa parte de las matemáticas.

La conclusión que he sacado de las lecturas de PageRank y el Surfista Aleatorio y Es mi internet y busco como quiero, y repasando las biografías de los creadores de Google Larry Page y Sergey Brin en la Wikipedia, es que el mérito de estos consiste en haber utilizado herramientas existentes al alcance de todos para dar solución a un problema gordo: cómo ordenar una ingente cantidad de información que cada año crecía de forma endiablada. En definitiva, que supieron innovar.

El problema requería de un modelado matemático que asegurara que los algoritmos usados eran correctos y de unas técnicas computacionales adecuadas para obtener una resolución efectiva y eficiente. No hay que olvidar que, cuando hacemos una búsqueda en Google, en milisegundos nos da el resultado tras haber analizado millones de páginas web. Y para conseguirlo, Page y Brin echaron mano del álgebra lineal básica de matrices y resolución de sistemas de ecuaciones (creo recordar que eso era lo que hacía yo en COU), y lo aplicaron para calcular los valores de los grafos que representan las preferencias de los navegadores, que no dejan de ser relaciones binarias entre páginas webs. Otro de los aciertos de su algoritmo es que ha permitido ir mejorándolo a medida que se descubrían sus limitaciones o que cambiaban las características y las necesidades de la red.

Si no he entendido mal, el algoritmo llamado Pagerank que utilizaba Google en sus inicios (y que se llevó por delante al resto de buscadores de la época) para ordenar la relevancia de las webs cuando se hace una búsqueda, se basa, en primer lugar, en un grafo que representa las relaciones entre todas las webs en función de los enlaces que llevan de unas a otras; estas relaciones se ordenan en una tabla, que en matemáticas se denomina matriz, y se les asigna una probabilidad de que sucedan. Supongo que una cuestión importante será acertar con el valor que se dé a esa probabilidad, para ajustarse lo máximo posible a la realidad. A continuación, mediante una serie de pasos utilizando el cálculo matricial se obtiene el peso de cada página web.

En la actualidad, parte de estos cálculos no se conocen, por ejemplo, el cálculo citado de la probabilidad de visita de cada página. Así, entre otras cosas, se evita que sea manipulable por medios externos para posicionar una página artificialmente. Y, en sentido contrario, Google puede modificar los parámetros a voluntad si pagas para estar mejor posicionado. Parece ser que el algoritmo actual es una mezcla de algoritmos, donde el Pagerank original cada vez tiene menos peso. Por otro lado, como he dicho antes, otra de las ventajas que tiene Google es su capacidad de mejora, por ejemplo, adaptándose a las necesidades del cliente: ahora tiene en cuenta las búsquedas anteriores del usuario para darle un resultado de búsqueda personalizado. Es decir, dos personas diferentes que hagan la misma búsqueda obtendrán resultados diferentes. Supongo que todas estas nuevas características llevan consigo el ir aumentando los elementos que forman los algoritmos y, por tanto, su complejidad; y que esto sea técnicamente posible gracias a la creciente capacidad de procesamiento de los ordenadores.

Personalmente me resulta admirable la capacidad de los matemáticos y las matemáticas para representar un problema complejo con todos los elementos que lo componen, junto con las relaciones entre ellos y los factores que les afectan, y asignarle a cada uno de ellos un valor adecuado; posteriormente, ir paso a paso haciendo cálculos y, si hace falta, dando rodeos cuando, aparentemente, se ha llegado a un callejón sin salida, hasta conseguir, finalmente, llegar al objetivo. Quizás sea porque disponen de forma innata de un algoritmo mental que les da la capacidad de abstracción necesaria para hacer unos análisis tan finos.