Desde hace bastante tiempo sabemos que Google emplea técnicas manuales (complementarias a su algoritmo de relevancia), para determinar si los resultados obtenidos son o no relevantes, y esto lo hace mediante los llamados “Quality Rater” personas de carne y hueso que están permanentemente evaluando los resultados de las búsquedas.
Algunos hasta se animaron a publicar los diferentes tipos de escalas de calificación que emplea Google en sus evaluaciones y que se filtraron a través de un paper interno. Estas escalas de calidad para evaluar los resultados de un determinado query son: Vital, Útil, Relevante, No relevante y Off Topic.
También Javier Casares hablaba en su momento del Google Quality Raters Handbook y cómo filtran los humanos los resultados de Google y daba una clara explicación de cómo Google interpretaba tres de estos factores de relevancia.
Ayer, Scott Huffman (Engineering Director) escribió un excelente articulo sobre como Google evalúa los resultados de sus búsquedas y me gustaría hacer algunos comentarios al respecto de un párrafo en particular que me llamo la atención.
“Traditional search evaluation has focused on the relevance of the results, and of course that is our highest priority as well. But today’s search-engine users expect more than just relevance. Are the results fresh and timely? Are they from authoritative sources? Are they comprehensive? Are they free of spam? Are their titles and snippets descriptive enough? Do they include additional UI elements a user might find helpful for the query (maps, images, query suggestions, etc.)? Our evaluations attempt to cover each of these dimensions where appropriate.”
Hasta ahora siempre que hablamos de “resultados relevantes”, nos referíamos a lo que Google consideraba importante para el usuario que realizaba la búsqueda y como los resultados se ajustaban de una manera “permitente” hacia dicha búsqueda.
Hoy siguen dándole prioridad a esta “relevancia” pero con algunos agregados que vale la pena mencionar y que surgen mediante los siguientes interrogantes:
- Los resultados son frescos y oportunos?
- Son de fuentes de cierta autoridad?
- Están libres de Spam?
- Los títulos y la descripción de los snippets son realmente descriptivos?
- Tiene información adicional que pueda ser útil para la búsqueda como fotos, mapas, etc.
A veces cabe un ejemplo para ver de que estamos hablando cuando hablamos de resultados “frescos y oportunos” y podemos utilizar algo que sucedió estos días y genero algo de polémica.
Si realizamos esta búsqueda “penalizacion de contenido duplicado” veremos la entrada de Adseok en primer lugar, con una antigüedad de menos de un día. Ahora el segundo resultado es de Dirson y data del día 6 de julio de 2005. Claramente el post de Dirson es atemporal y en este sentido, a quedado totalmente desactualizado.
Diviértanse mirando el resto de los resultados y verán porque a Google le interesa mucho mejorar en estos aspectos:
- imeneame.net posiciona 7mo y la entrada indexada ya no existe.
- En la posición 11, posiciona un agregador de noticias “seoweb.corank.com” que hace referencia también a la entrada de Adseok, pero con un link a su feed.
- En la posición 12, nos encontramos con un tag de “es.wordpress.com” que arroja este error “Lo lamentamos, no tenemos posts con la palabra clave elegida. Quizás quisieras probar con uno de los sitios que te sugerimos aquí abajo.”
- En la posición 18, encontramos a “meaviso.com” (sin palabras), que posiciona con la entrada de Adseok, mejor que la de Chica Seo, que con contenido original, solo alcanza el puesto 20, ultimo de la segunda pagina.
Ya saben, si les interesa trabajar para Google y darle una manito con las evaluaciones de los resultados de búsquedas, pueden aplicar como “Quality Rater” aquí.


Es cierto, muchas de los resultados que ofrece Google en los primeros puestos son completamente atemporales y para corregir eso, ni siquiera hace falta un ser humano que lo verifique. Bastaría con ir aplicando una penalización automática en función del tiempo que ha pasado desde que el bot indexó esa página.