Se conoce como internet profunda, internet invisible1
o internet oculta
al contenido de internet
que no es indexado por los motores de búsqueda convencionales,
debido a diversos factores. El término se atribuye al informático
Mike Bergman
. Es el opuesto al Internet
Superficial.
La internet profunda es un conjunto de
sitios web y bases de datos que buscadores comunes no pueden
encontrar ya que no están indexadas. El contenido que se puede
hallar dentro de la internet profunda es muy amplio.
La internet
superficial se compone de páginas estáticas o fijas, mientras
que la web profunda está compuesta de páginas dinámicas. La
páginas estáticas no dependen de una base de datos para desplegar
su contenido sino que residen en un servidor en espera de ser
recuperadas, y son básicamente archivos HTML
cuyo contenido nunca cambia. Todos los cambios se realizan
directamente en el código y la nueva versión de la página se carga
en el servidor. Estas páginas son menos flexibles que las páginas
dinámicas. Las páginas dinámicas se crean como resultado de una
búsqueda de base de datos. El contenido se coloca en una base de
datos y se proporciona solo cuando lo solicite el usuario.
Motivos por los que los motores de búsqueda no pueden indexar
algunas páginas:- Web contextual: páginas cuyo contenido varía dependiendo del contexto (por ejemplo, la dirección IP del cliente, de las visitas anteriores, etc).
- Contenido dinámico: páginas dinámicas obtenidas como respuesta a parámetros, por ejemplo, datos enviados a través de un formulario.
- Contenido de aceso restringido: páginas protegidas con contraseña, contenido protegido por un Captcha, etc.
- Contenido No HTML: contenido textual en archivos multimedia, otras extensiones como exe, rar, zip, etc.
- Páginas no enlazadas: páginas que los buscadores no
tienen referencia de su existencia, por ejemplo, páginas que no
tienen enlaces desde otras páginas.
La web profunda (o deep web) como
concepto en ese sentido, debe abarcar un conjunto muy grande de
sitios, dado que la condición fundamental es no poder ser
atrapado por un buscador estándar.
Lo fundamental de la web invisible es
su potencial de abrir las puertas a información de alta calidad y
especialidad temática. Así, las bases de datos de las grandes
universidades y centros de investigación, que reúnen tesis,
artículos analíticos, publicaciones de libre acceso, planos,
gráficos y similares, existen y están abiertas para que sean
consultadas y aprovechadas de acuerdo a sus términos de uso.
La Internet invisible ya no está tan oculta como antes y gracias
a los metabuscadores (buscadores de buscadores) es posible rastrear
fuentes de bases de datos, que permiten acceder a la información
alojada en la web profunda, como estos que reseña Luis Castro en
‘¿Qué
es Deep web?’:
• Scirus,
usado para búsquedas de información científica.
• Infomine,
búsquedas de material escolar de todo tipo.
• FreeLunch,
búsquedas de datos económicos.
• CompletePlanet,
búsquedas de diversos temas.
• Archive,
metabuscador para rastrear temas específicos.
• Search
Engine Guide, metabuscador que permite encontrar un buscador o
base de datos relacionada con el tema de interés.
No hay comentarios:
Publicar un comentario