INTERNET ACADEMIA INVISIBLE DE DEEP WEB



Internet academia  invisible de Deep web




Cómo entrar a la Deep Web? Te decimos paso a pasoSe denomina Internet Académica Invisible o Academic Invisible Web (AIW) a el conjunto de bases de datos y colecciones relevantes para la academia, o con fines académicos, que no es posible ser buscado por los motores de búsqueda convencionales. La preocupación sobre este tema radica en que millones de documentos permanecen invisibles frente a los ojos de los usuarios convencionales. Dentro de estos documentos se pueden encontrar artículos, libros, reportes, documentos de acceso abierto, datos de encuestas, entre otros. El problema con los motores de búsqueda convencionales es que no muestran aquellos datos que cambian constantemente, como información climática o imágenes satelitales y dicha información, al cambiar de manera tan rápida es imposible de ser indexada por lo que restringe su aparición en los motores de búsqueda convencionales.
Una aproximación al indexamiento y apertura de la Internet académica invisible son los motores de búsqueda que se centran en información académica, como Google Scholar o Scirus. El problema de estos motores de búsqueda mencionados anteriormente es que fueron creados por compañías comerciales. El portal de ciencia Vascoda ha demostrado ser la alternativa más efectiva para eliminar el espacio entre la Internet académica visible e invisible ya que integra bases de datos de literatura, colecciones de librerías y demás contenido académico mediante un indexamiento basado en el uso de las etiquetas de cada uno de los dominios que albergan dicha información.
Cabe resaltar que no toda la ausencia de esta información en la Internet Visible se debe a los motores de búsqueda, otro de estos factores se debe a que algunos de estos documentos son propiedad de editoriales de base de datos.
Tamaño de la Internet académica invisible.
El intento más acertado por realizar una medición de la cantidad de documentos académicos presentes en la web invisible fue realizado por Bergman en 2001 en su estudio The Deep Web: Surfacing Hideen Value. En dicha investigación Bergman realizó un listado de los 60 sitios académicos más largos de la Deep Web entre los que se encontraba el National Climatic Data Center (NOAA), NASA EOSDIS, National Oceanographic (combined with Geophysical) Data Center (NOAA), entre otras.
Los sesenta sitios de la Deep Web más grandes
Nombre
Tipo
Tamaño (GBs)
National Climatic Data Center (NOAA)
Público
366,000
NASA EOSDIS
Público
219,600
National Oceanographic (combined with Geophysical) Data Center (NOAA)
Público/Pago
32,940
DBT Online
Pago
30,500
Alexa
Público (parcial)
15,860
Right-to-Know Network (RTK Net)
Público
14,640
Lexis-Nexis
Pago
12,200
Dialog
Pago
10,980
Genealogy - ancestry.com
Pago
6,500
MP3.com
Público
4,300
Terraserver
Público/Pago
4,270
ProQuest Direct (incl. Digital Vault)
Pago
3,172
Dun & Bradstreet
Pago
3,113
Westlaw
Pago
2,684
Dow Jones News Retrieval
Pago
2,684
HEASARC (High Energy Astrophysics Science Archive Research Center)
Público
2,562
US PTO - Trademarks + Patents
Público
2,440
Informedia (Carnegie Mellon Univ.)
Público
1,830
infoUSA
Pago/Público
1,584
Alexandria Digital Library
Público
1,220
JSTOR Project
Limitado
1,220
10K Search Wizard
Público
769
UC Berkeley Digital Library Project
Público
766
SEC Edgar
Público
610
US Census
Público
610
Elsevier Press
Pago
570
NCI CancerNet Database
Público
488
EBSCO
Pago
481
Amazon.com
Público
461
IBM Patent Center
Público/Privado
345
NASA Image Exchange
Público
337
Springer-Verlag
Pago
221
InfoUSA.com
Público/Privado
195
OVID Technologies
Pago
191
Investext
Pago
157
Blackwell Science
Pago
146
Betterwhois (muchos similares)
Público
152
GPO Access
Público
146
Adobe PDF Search
Público
143
Internet Auction List
Público
130
Commerce, Inc.
Público
122
Library of Congress Online Catalog
Público
116
GenServ
Pago
106
Academic Press IDEAL
Pago
104
Sunsite Europe
Público
98
Uncover Periodical DB
Público/Pago
97
Astronomer's Bazaar
Público
94
eBay.com
Público
82
Tradecompass
Pago
61
REALTOR.com Real Estate Search
Público
60
Federal Express
Público
53
Integrum
Público/Privado
49
NIH PubMed
Público
41
Visual Woman (NIH)
Público
40
AutoTrader.com
Público
39
UPS
Público
33
NIH GenBank
Público
31
AustLi (Australasian Legal Information Institute)
Público
24
Digital Library Program (UVa)
Público
21
INSPEC
Pago
16
Subtotal fuentes públicas y mixtas
673,035
Subtotal fuentes pagas
75.469
TOTAL
748,504
El problema con dicha medición es que se realizó por el tamaño de la página (en GB) más no por la cantidad de artículos publicados. No obstante dicha cantidad expresaba que se albergaba más de 700TB (o 700000GB) de información que no está expuesta en la Internet superficial.
Esta información es complementada por Lewandosky adicionando datos de la Gale Directory of Databases los cuales fueron comparados con los datos de Bergman. En dicho directorio se aproximó que existe un total de 18.92 billones de documentos académicos en total.

Comentarios

Entradas populares de este blog

Teleprocesos y telecomunicaciones

ORIGEN DEL DEEP WEB

Entorno virtual con la tecnología de información