MOTORES DE BUSQUEDA
Un motor de búsqueda es un software que indexa archivos almacenados en los servidores web, un ejemplo son los buscadores de internet (algunos buscan sólo en la Web pero otros buscan además en News, Gopher, FTP, etc.) cuando les pedimos información sobre algún tema. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones Web en los que se mencionan temas relacionados con las palabras clave buscadas. Se pueden clasificar en dos: Índices temáticos: Son sistemas de búsqueda por temas o categorías jerarquizados (aunque también suelen incluir sistemas de búsqueda por palabras clave). Se trata de bases de datos de direcciones Web elaboradas "manualmente", es decir, hay personas que se encargan de asignar cada página web a una categoría o tema determinado. Motores de búsqueda: Son sistemas de búsqueda por palabras clave. Son bases de datos que incorporan automáticamente páginas web mediante "robots" de búsqueda por la red. Como operan en forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas (lo cual puede ser muy limitativo). Los buenos directorios combinan ambos sistemas.
1. Los Spiders: La mayoría de grandes buscadores internacionales que todos usamos y conocemos son de este tipo. Requieren muchos recursos para su funcionamiento. No están al alcance de cualquiera.
Recorren las páginas recopilando información sobre los contenidos de las páginas. Principalmente el texto que en ellas aparece. Cuando buscamos una información en los motores, ellos consultan su base de datos, con la información que han recogido de las páginas, y nos la presentan clasificados por su relevancia. De las webs, los buscadores pueden almacenar desde la página de entrada, a todas las páginas de la web. Depende de los gustos del buscador, y la consideración de importancia que tenga la web para ellos.
Si buscamos una palabra, por ejemplo [ordenadores]. En los resultados que nos ofrecerá el motor de búsqueda, aparecerán páginas que contengan esta palabra en alguna parte de su texto.
Si consideran que una web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, solo almacenan una o mas páginas. Aunque no necesariamente registran todas las webs que lo soliciten.
Cada cierto tiempo, los motores revisan las webs, para actualizar los contenidos de su base de datos, por lo que no es infrecuente, que los resultados de la búsqueda no estén actualizados, de forma que la información o la página no exista.
Los spiders, tienen una colección de programas simples y potentes con diferentes cometidos. Se suelen dividir en tres partes. Los programas que exploran la red -spiders-. Los que construyen la base de datos. Y los que utiliza el usuario, el programa que explora la base de datos.
La relevancia ó orden de presentación de los resultados de la consulta, viene determinada por diversos factores que dependen de cada buscador. Sería demasiado prolijo tratar lo que consideran los motores por relevancia, pero vamos a enumerar unas pocas. El tráfico, puede ser un factor de relevancia. El tipo de web, y la información que contienen son otros factor importantes, debido al análisis que realizan del contexto.
Otro factor para la relevancia, común a muchos buscadores y sitios de internet, es: si pagamos para tener una mayor visibilidad en los resultados de la búsqueda. Es decir si les pagamos nos dan un bonus que nos permitirá aparecer en las primeras páginas de resultados. Esta forma de publicidad, ahora mismo, es indicada de alguna forma. Los spiders se han visto obligados a este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio de forma gratuita.
2.Los Directorios: Una barata tecnología, que es ampliamente utilizada por la cantidad de programas scripts en el mercado. No se requieren muchos recursos de informática. Están muy extendidos en la red por estos motivos. En cambio, se requiere mas soporte humano y mantenimiento.
Son motores buscadores completamente distintos a los spiders. En estos, los algoritmos son mucho mas sencillos, presentando la información sobre las webs registradas como una colección de directorios. No recorren las webs ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra página. Como el título y la descripción de la web que se introduzcan a la hora de registrar las webs.
Los resultados de la búsqueda, estarán determinados por la información que se haya suministrado al directorio cuando se registra la web. En cambio, a diferencia de los motores, son revisadas por operadores humanos, y clasificadas según categorías, de forma que es mas fácil encontrar webs de el tema de nuestro interés.
Mas que buscar información sobre contenidos de la página, los resultados serán presentados haciendo referencia a los contenidos y temática de la web. Es decir, si buscamos "ordenadores", aparecerán webs que de una forma u otra estén relacionados con la temática de ordenadores. Sus posibilidades de búsqueda de contenidos, en la mayoría de los casos, son inexistentes.
Su tecnología, es muy barata y sencilla. Imagínese que es una base de datos como la que usted utiliza, sobre la que se realizan búsquedas. Tiene un coste de operación relativamente alto, pues tiene que ser operado por humanos práctica y exclusivamente.
Son apropiados para buscar categorías, mas que informaciones específicas. Para visitar sitios de temática común. Es la tecnología que utilizan portales y buscadores de sectores especializados como economía, derecho, naturaleza, deportes, famosos, humanidades, .. ..
Ejemplos de directorios: Antigus directorios, Yahoo, Terra (Antíguo Olé). Ahora, ambos utilizan tecnología spider, y Yahoo, conserva su directorio. Buscar Portal, es un directorio, y la mayoría de motores hispanos son directorios.
3. LOS SISTEMAS MIXTOS BUSCADOR - DIRECTORIO: Son una mezcla entre buscadores y directorio. Además de tener características de buscadores, presentan las webs registradas en catálogos sobre contenidos. Informática, cultura, sociedad. Que a su vez se dividen en subsecciones.
Ejemplo de sistema mixto buscador - directorio: Excite, Voila, Infoseek. Los motores en la actualidad, suelen tender hacia sistemas mixtos como ha ocurrido con Altavista.
MetabuscadoresMetabuscadores.
4. METABUSCADORES: En realidad, no son buscadores. Lo que hacen, es realizar búsquedas en auténticos buscadores, analizan los resultados de la página, y presentan sus propios resultados. No suelen ser bien venidos por los buscadores. Para utilizar los servicios gratuitos de un buscador de esta forma, es necesario pedir permiso. El motivo es el siguiente:El Buscador, pone el dinero para opera el servicio, los contenidos que utilizará el metabuscador, y no percibe nada a cambio. Al eliminar la publicidad, no se obtienen ingresos. Solo gasto y pérdida de visitantes que utilicen este servicio de búsqueda.
5. MULTIBUSCADORES: Una categoría que oficialmente, no existe. Digamos que no está muy extendida, y que he puesto aquí, porque nosotros lo utilizamos. Permite lanzar varias búsquedas en motores seleccionados respetando el formato original de los buscadores. Hemos desarrollado nuestra propia tecnología de multibuscadores.
6. FFA ENLACES GRATUITOS PARA TODOS: FFA, página de enlaces gratuitos para todos. Cualquiera puede inscribir su página durante un tiempo limitado en estos pequeños directorios. Los enlaces, no son permanentes.
7. BUSCADORES DE PORTAL: Bajo este título, englobamos los buscadores específicos de sitio. Aquellos que buscan información solo en su portal o sitio web. Podríamos considerarlos como un directorio. No obstante, como están basados en expresiones regulares y consultas SQL, vamos a intentar ayudarles a manejar mejor estas herramientas.Si trabaja en temas de administración, sabrá por experiencia la necesidad de conocer bien estos buscadores, a los que no se da la importancia que requieren.