++VITAE Academia Biómedica Digital

Marzo-Mayo 2001 N°7

ISSN 1317-987X

Buscar

De interés

	Introducción

	Comunicación

	Fuentes www

	Métodos de recuperación

	Revistas Electrónicas

	Internet, ¿él no va más en actualización?

	Referencias bibliográficas

Medicina tropical, internet y las corrientes actuales en la comunicación biomédica

Métodos de recuperación

Motores de búsqueda

En vez de navegar de enlace a enlace o de depender de directorios temáticos jerárquicos, los motores de búsqueda generales como AltaVista, Fast, Google, HotBot o Northern Light ofrecen la posibilidad de encontrar artículos específicos, sin importar su ubicación; sin embargo, existen limitaciones básicas, ninguno de estos motores de búsqueda abarca todos los sitios web disponibles en Internet (Notess, 1998a). Aun cuando se anuncia constantemente la creación de otro nuevo índice web general y la reestructuración de varios existentes, parece que Internet crece a pasos demasiado agigantados para estos índices. Las comparaciones siempre indican una pobre cobertura y una superposición entre los motores de búsqueda más importantes. Si en 1998 los índices web más amplios todavía podían ofrecer 30% de cobertura (Lawrence y Giles, 1998), un año más tarde se estimó una caída de 16% en la cobertura máxima (Lawrence y Giles, 1999).

Además de no abarcar el volumen de posibilidades de la Red, pareciera que las habilidades de búsqueda de los índices web no van a mejorar sustancialmente, porque la recuperación es esencialmente un procedimiento basado en una palabra y no en un concepto, por lo que muchas páginas web útiles serán pasadas por alto debido a la terminología empleada, mientras que los "accesos" tienden a ser irrelevantes. Existen varias diferencias en la precisión (incorporar sólo resultados pertinentes) y la memoria (encontrar tantos resultados como sean posibles), todo depende de las técnicas utilizadas, como la búsqueda Booleana, el truncamiento (automático) y la longitud de los listados (sólo las primeras páginas vs. las últimas). Después de las preguntas referentes a la comprensión y la calidad de la recuperación surge la de la rapidez, aunque, al principio, los motores indizados aseguraban que visitaban las páginas web que cubrían una vez al mes, en realidad, los enlaces listados, por lo general, tienen seis meses sin actualización y muchos de ellos desaparecerán o serán reubicados para cuando se acceda a ellos a través de estos índices web. Por ello, siendo realistas, podemos comparar la búsqueda en Internet con la expresión popular "buscar una aguja en un pajar".

Meta-información

Una estrategia que puede mejorar la recuperación de información es utilizar "meta-información", cuyo propósito es "catalogar" páginas web (Milstead y Feldman, 1999a, b), desafortunadamente, se abusa de esta y otras estrategias parecidas para aumentar aparente y artificialmente la popularidad de algunos sitios web. Ya que todos descubriremos y utilizaremos estos "trucos", se nos recuerda la Reina Roja de Lewis Carroll, en la que se señala que necesitamos poner todo de nuestra parte para permanecer en el mismo lugar (Carrol, 1982), una idea no menos perversa que la infinita y por ende insignificante planteada por Borges en La Biblioteca de Babel (Borges, 1970), citada por Deering et al. (1995).

Motores de búsqueda múltiples

Quizás también se pueda mejorar la recuperación de información utilizando meta-índices web, como Inference Find, Go Network Express Search de Infoseek o Savysearch, que combinan una selección personalizada de varios motores de búsqueda individuales. La poca o moderada superposición entre motores de búsqueda significa que se podrían incluir más sitios en dichas búsquedas, aunque el uso de estos buscadores múltiples también podría pasar por alto varios sitios debido al número limitado de accesos por índice o a la incompatibilidad entre los comandos de los buscadores. Aunque los expertos pueden beneficiarse de su conocimiento sobre la sintaxis de un índice web en particular, valerse de estas operaciones sofisticadas puede ser improductivo y quizás hasta interfiera en el desempeño de otro motor de búsqueda que participe en la meta-búsqueda (Notess, 1998b).

Agentes inteligentes

Los llamados "agentes inteligentes" o los "robots de conocimiento" (knowbot), como Autonomy (Tegenbos y Nieuwenhuysen, 1997), son aún más sofisticados y se basan en programas que viajan por Internet buscando información que concuerde con los parámetros definidos por el usuario, y, entretanto, analizan y memorizan sus preferencias. Aun cuando estos programas han estado disponibles desde hace varios años, no son utilizados ampliamente por el buscador "común".

A pesar de las desventajas mencionadas anteriormente, los índices web son prometedores, como lo muestra su gran cobertura de los diferentes tipos de materiales, siempre en expansión; actualmente no se limitan a páginas web, también incluyen noticias, grupos de noticias y directorios. Este enfoque les permite realizar búsquedas más selectivas, como limitar el tema, el área geográfica, el idioma o el dominio, y utilizar mejores estrategias de búsqueda. Últimamente, ha mejorado la relevancia del rango (Notess, 1999), además de una mejora en la recuperación de la información, los motores de búsqueda más populares ahora ofrecen servicios añadidos, como traducción automática, información de directorios (compañías, páginas amarillas y blancas) y acceso inmediato a distintas clases de noticias o material de referencia.

Incluso si, al combinar todas estas herramientas prometedoras, fuera posible catalogar todo lo que aparece en la Red, muchas páginas quedarían ocultas; existe una gran cantidad de información que no está disponible, como las bases de datos comerciales (a las que sólo se puede acceder si se paga), y las Intranets. Aunque se incorporara toda esta información a los índices web, una enorme cantidad de data todavía no estaría disponible en formato electrónico.

Bases de datos

Las bases de datos objetivas tienen información que quizás no haya estado disponible anteriormente y la hacen accesible a mayor escala, ejemplos comunes son las bases de datos demográficas (como las del DHS), las bases de datos estadísticas y epidemiológicas (disponibles en la OMS) y las bases de datos sobre el genoma, como las National Center for Biotechnology (NCBI; ej. Entrez), ExPASy (ej. Swiss-Prot) o del Institute for Genomic Research (TIGR; ej. La TGR Parasites Database). Temas más específicos se tratan en proyectos menos ambiciosos, como la Microbacterial Database (MycDB), la Leishmania Genome Network o la Trypanosoma cruzi Genome Initiative.

Las bases de datos bibliográficas como la de Medline, una categoría especial que no es realmente nueva pero que cada vez es más accesible en Internet, junto con otras bases de datos (ej. Popline y la más reciente Cochrane Library) representan ejemplos claros de fuentes de información de calidad controlada que utilizan primordialmente Internet para conectarse, pero tienen sus orígenes en otro lugar. Estas bases de datos estaban disponibles en línea o en CD-ROM bajo suscripción, y han probado su efectividad y credibilidad, son bastante disímiles de las fuentes generadas por Internet que pueden encontrarse a través de los índices web pero su representación y "autoridad" no son claras. Por el contrario, Medline y otras bases de datos similares están básicamente limitadas debido a que cubren sólo una sección de las publicaciones tradicionales impresas y por lo general son resúmenes (aunque se están creando enlaces electrónicos al texto total del artículo), el contenido de las bases de datos tampoco está incorporado en los índices web. El hecho de que Medline y otras bases de datos de la National Library of Medicine (NLM), como HealthStar y AidsLine, puedan estar disponibles gratuitamente es más el resultado de una política de decisiones de alto nivel, que la filantropía de la industria de la información.

En la actualidad, existe una fuerte tendencia a aumentar la conectividad y la integración, por ejemplo, al enlazar varias bases de datos bibliográficas y referentes al genoma, por una parte, y bases de datos con texto completo, por la otra, preferiblemente a un nivel de registros individuales o de sus partes constitutivas.

Continua: Revistas Electrónicas

NOTA: Toda la información que se brinda en este artículo es de carácter investigativo y con fines académicos y de actualización para estudiantes y profesionales de la salud. En ningún caso es de carácter general ni sustituye el asesoramiento de un médico. Ante cualquier duda que pueda tener sobre su estado de salud, consulte con su médico o especialista.


	Instituto de Medicina Tropical - Facultad de Medicina - Universidad Central de Venezuela. Elaborado por el Centro de Análisis de Imágenes Biomédicas Computarizadas CAIBCO, caibco@ucv.ve
	Este portal ha sido desarrollado gracias al apoyo del Fonacit