EL RINCÒN DE JOSÈ MIGUEL: WEB SUPERFICIAL Y WEB PROFUNDA

Se conoce como internet profunda, internet invisible1 o internet oculta al contenido de internet que no es indexado por los motores de búsqueda convencionales, debido a diversos factores. El término se atribuye al informático Mike Bergman . Es el opuesto al Internet Superficial.

La internet profunda es un conjunto de sitios web y bases de datos que buscadores comunes no pueden encontrar ya que no están indexadas. El contenido que se puede hallar dentro de la internet profunda es muy amplio.

La internet superficial se compone de páginas estáticas o fijas, mientras que la web profunda está compuesta de páginas dinámicas. La páginas estáticas no dependen de una base de datos para desplegar su contenido sino que residen en un servidor en espera de ser recuperadas, y son básicamente archivos HTML cuyo contenido nunca cambia. Todos los cambios se realizan directamente en el código y la nueva versión de la página se carga en el servidor. Estas páginas son menos flexibles que las páginas dinámicas. Las páginas dinámicas se crean como resultado de una búsqueda de base de datos. El contenido se coloca en una base de datos y se proporciona solo cuando lo solicite el usuario.

Motivos por los que los motores de búsqueda no pueden indexar algunas páginas:

Web contextual: páginas cuyo contenido varía dependiendo del contexto (por ejemplo, la dirección IP del cliente, de las visitas anteriores, etc).
Contenido dinámico: páginas dinámicas obtenidas como respuesta a parámetros, por ejemplo, datos enviados a través de un formulario.
Contenido de aceso restringido: páginas protegidas con contraseña, contenido protegido por un Captcha, etc.
Contenido No HTML: contenido textual en archivos multimedia, otras extensiones como exe, rar, zip, etc.
Software: Contenido oculto intencionadamente, que requiere un programa o protocolo específico para poder acceder (Ejemplos: Tor, I2P)
Páginas no enlazadas: páginas que los buscadores no tienen referencia de su existencia, por ejemplo, páginas que no tienen enlaces desde otras páginas.

La web profunda (o deep web) como concepto en ese sentido, debe abarcar un conjunto muy grande de sitios, dado que la condición fundamental es no poder ser atrapado por un buscador estándar.

Lo fundamental de la web invisible es su potencial de abrir las puertas a información de alta calidad y especialidad temática. Así, las bases de datos de las grandes universidades y centros de investigación, que reúnen tesis, artículos analíticos, publicaciones de libre acceso, planos, gráficos y similares, existen y están abiertas para que sean consultadas y aprovechadas de acuerdo a sus términos de uso.

La Internet invisible ya no está tan oculta como antes y gracias a los metabuscadores (buscadores de buscadores) es posible rastrear fuentes de bases de datos, que permiten acceder a la información alojada en la web profunda, como estos que reseña Luis Castro en ‘¿Qué es Deep web?’:

• Scirus, usado para búsquedas de información científica.

• Infomine, búsquedas de material escolar de todo tipo.

• FreeLunch, búsquedas de datos económicos.

• CompletePlanet, búsquedas de diversos temas.

• Archive, metabuscador para rastrear temas específicos.

• Search Engine Guide, metabuscador que permite encontrar un buscador o base de datos relacionada con el tema de interés.

EL RINCÒN DE JOSÈ MIGUEL

BIENVENIDOS INTERNAUTAS.

viernes, 26 de febrero de 2016

WEB SUPERFICIAL Y WEB PROFUNDA

No hay comentarios:

Publicar un comentario