Congreso Ojobuscador: Ricardo Baeza

Estamos en la sala del congreso de OJObuscador, así que perdonarme las faltas, las frases tipo notas, y el volumen de conceptos, mañana intentará retocar y asimilar todos los datos

09,45 hs. Los desafíos de buscar en la web, Ricardo Baeza
El profesor Ricardo Baez explica brevemente la historia de los buscadores desde sus comienzos… Webcrawler, Altavista .. Google, y la salida de buscadores de pago por resultados, Goto, Overture.

Relevancia de las búsquedas, calidad de los datos ..

Necesidades de búsqueda: Información, herramientas de navegación (ucha gente le resulta más cómodo buscar el nombre de una empresa y clickar en el primer resultado que escribirlo en la barra de navegación) o transacciones (interactuar con la web).

Muchas preguntas poco frecuentes, pocas preguntas muy frecuentes. A la hora de invertir en publcidad hay que tener en cuenta que las primeras serán más económicas que las segundas.

También nos comenta las características de un buscador, link rankings (sobrevalorado), mirrors (páginas espejo, más del 15% de la web está duplicada).

Arquitectura de un buscador, funcionamiento. Como procesa las consultas, eliminando stopwords, realiza la búsqueda y devuelve las posiciones (rankings).

Crawling: Cantidad de páginas indexadas, Freshness (actualizadas), Calidad y Reglas de educación para buscadores (tiempos entre petición y petición)

Ranking: Palabras, enlaces, logs, anchor texts, metadata … (spam)

Spam específico a robots – Cloacking

Explicación del funcionamiento de un crawler, como trabajan los buenos (atacando primero a las mejores webs) y como lo hacen los que no son tan buenos.

Link Ranking: Los primeros en tener en cuent los links como valor para rankings, fueron Li y Marchori, Carriere (en el 97), Joo & Myaeng (98)

HITS: En el 98 Kleinberg aplica por primera vez os Hubs & Authorities. Más tarde Larry Page & Sergey Brin, utilizan el modelo del pagerank.

Una visión de futuro en los bucadores sería la utilización de IPs para determinar paises, personalizar el tipo de búsqueda, histórico de consultas…

Intentar adivinar el tipo de consulta por la forma de pedir la información, si es técnic o si es muy general. En el futuro podremos desplazar una barra para determinar si estamos buscando información sobre productos (compras) o solo buscamos información (research).

Mucha información crea poca atención (Simon, 71).

La web es un reflejo de la sociedad (hace diez años no lo era, era información técnica). Los enlaces de la web, son el reflejo de la actividad económica del mundo.

Del blog de Abel Gonzalez, sacó de un comentario de Tomy donde está el estudio del Profesor Ricardo Baeza con datos que mencionó en la ponencia

2 Comments

  1. Gracias por el seguimiento en directo, Rubén. Te leemos !

  2. Ya, pero esto va muy rápido. Perdón por las anotaciones tipo teletipo pero no da para más (al menos por hoy)

Comments are closed.

© 2019 Online

Theme by Anders NorénUp ↑