INTERNET ACADEMIA INVISIBLE DE DEEP WEB
Internet academia invisible de Deep web

Una aproximación al indexamiento y
apertura de la Internet académica invisible son los motores de búsqueda que se
centran en información académica, como Google Scholar o Scirus. El problema de estos motores de
búsqueda mencionados anteriormente es que fueron creados por compañías
comerciales. El portal de ciencia Vascoda ha demostrado ser la
alternativa más efectiva para eliminar el espacio entre la Internet académica
visible e invisible ya que integra bases de datos de literatura, colecciones de
librerías y demás contenido académico mediante un indexamiento basado en el uso
de las etiquetas de
cada uno de los dominios que albergan dicha información.
Cabe resaltar que no toda la ausencia
de esta información en la Internet Visible se debe a los motores de búsqueda,
otro de estos factores se debe a que algunos de estos documentos son propiedad
de editoriales de base de datos.
Tamaño de la Internet
académica invisible.
El intento más acertado por realizar
una medición de la cantidad de documentos académicos presentes en la web
invisible fue realizado por Bergman en 2001 en su estudio The Deep Web:
Surfacing Hideen Value. En dicha investigación Bergman
realizó un listado de los 60 sitios académicos más largos de la Deep Web entre
los que se encontraba el National Climatic Data Center (NOAA), NASA
EOSDIS, National Oceanographic (combined with Geophysical) Data Center (NOAA), entre
otras.
Los sesenta
sitios de la Deep Web más grandes
|
||
Nombre
|
Tipo
|
Tamaño (GBs)
|
National Climatic Data Center
(NOAA)
|
Público
|
366,000
|
NASA EOSDIS
|
Público
|
219,600
|
National Oceanographic (combined
with Geophysical) Data Center (NOAA)
|
Público/Pago
|
32,940
|
DBT Online
|
Pago
|
30,500
|
Alexa
|
Público (parcial)
|
15,860
|
Right-to-Know Network (RTK Net)
|
Público
|
14,640
|
Lexis-Nexis
|
Pago
|
12,200
|
Dialog
|
Pago
|
10,980
|
Genealogy - ancestry.com
|
Pago
|
6,500
|
MP3.com
|
Público
|
4,300
|
Terraserver
|
Público/Pago
|
4,270
|
ProQuest Direct (incl. Digital
Vault)
|
Pago
|
3,172
|
Dun & Bradstreet
|
Pago
|
3,113
|
Westlaw
|
Pago
|
2,684
|
Dow Jones News Retrieval
|
Pago
|
2,684
|
HEASARC (High Energy Astrophysics
Science Archive Research Center)
|
Público
|
2,562
|
US PTO - Trademarks + Patents
|
Público
|
2,440
|
Informedia (Carnegie Mellon Univ.)
|
Público
|
1,830
|
infoUSA
|
Pago/Público
|
1,584
|
Alexandria Digital Library
|
Público
|
1,220
|
JSTOR Project
|
Limitado
|
1,220
|
10K Search Wizard
|
Público
|
769
|
UC Berkeley Digital Library Project
|
Público
|
766
|
SEC Edgar
|
Público
|
610
|
US Census
|
Público
|
610
|
Elsevier Press
|
Pago
|
570
|
NCI CancerNet Database
|
Público
|
488
|
EBSCO
|
Pago
|
481
|
Amazon.com
|
Público
|
461
|
IBM Patent Center
|
Público/Privado
|
345
|
NASA Image Exchange
|
Público
|
337
|
Springer-Verlag
|
Pago
|
221
|
InfoUSA.com
|
Público/Privado
|
195
|
OVID Technologies
|
Pago
|
191
|
Investext
|
Pago
|
157
|
Blackwell Science
|
Pago
|
146
|
Betterwhois (muchos similares)
|
Público
|
152
|
GPO Access
|
Público
|
146
|
Adobe PDF Search
|
Público
|
143
|
Internet Auction List
|
Público
|
130
|
Commerce, Inc.
|
Público
|
122
|
Library of Congress Online Catalog
|
Público
|
116
|
GenServ
|
Pago
|
106
|
Academic Press IDEAL
|
Pago
|
104
|
Sunsite Europe
|
Público
|
98
|
Uncover Periodical DB
|
Público/Pago
|
97
|
Astronomer's Bazaar
|
Público
|
94
|
eBay.com
|
Público
|
82
|
Tradecompass
|
Pago
|
61
|
REALTOR.com Real Estate Search
|
Público
|
60
|
Federal Express
|
Público
|
53
|
Integrum
|
Público/Privado
|
49
|
NIH PubMed
|
Público
|
41
|
Visual Woman (NIH)
|
Público
|
40
|
AutoTrader.com
|
Público
|
39
|
UPS
|
Público
|
33
|
NIH GenBank
|
Público
|
31
|
AustLi (Australasian Legal
Information Institute)
|
Público
|
24
|
Digital Library Program (UVa)
|
Público
|
21
|
INSPEC
|
Pago
|
16
|
Subtotal fuentes
públicas y mixtas
|
673,035
|
|
Subtotal fuentes
pagas
|
75.469
|
|
TOTAL
|
748,504
|
El problema con dicha medición es que
se realizó por el tamaño de la página (en GB) más no por la cantidad de
artículos publicados. No obstante dicha cantidad expresaba que se albergaba más
de 700TB (o 700000GB) de información que no está expuesta en la Internet superficial.
Esta información es complementada por
Lewandosky adicionando datos de la Gale Directory of
Databases los cuales fueron comparados con los datos de Bergman. En dicho directorio se aproximó que
existe un total de 18.92 billones de documentos académicos en total.
Comentarios
Publicar un comentario