Prin însăși natura sa, dimensiunea Deep Web este dificil de calculat. Dar cercetătorii universităților de top spun că Internetul pe care îl cunoaștem – Facebook, Wikipedia, știrile – reprezintă mai puțin de 1% din întregul World Wide Web.
Atunci când navigăm pe Internet, de fapt plutim doar la suprafața lui. Dacă ne-am putea scufunda în adâncurile lui am da peste zeci de mii de miliarde de pagini – un număr inimaginabil – pe care majoritatea oamenilor nu le-au văzut. Acestea includ totul, de la statistici plictisitoare până la păți ale corpului uman de vânzare (ilegal).
Deși Deep Web-ul este puțin cunoscut, conceptul său este destul de simplu. Gândiți-vă la el în raport cu motoarele de căutare. Pentru a vă oferi rezultatele căutărilor, Google, Yahoo! și Bing-ul celor de la Microsoft indexează constant pagini. Ele fac acest lucru urmărind linkurile dintre siteuri, târând firele web-ului ca un păianjen. Dar asta le permite să adune doar pagini statice, precum cea pe care vă aflați în acest moment. Ce nu reușesc ele să capteze sunt paginile dinamice, cum sunt cele care se generează atunci când adresezi o întrebare unei baze de date online. Luați în considerare rezultatele unei interogări pe siteul Biroului de Recensământ al Statelor Unite. „Atunci când crawler-ul ajunge la o bază de date, de obice nu poate urmări linkurile în conținutul lor profund în spatele căsuței de căutare“, spune Nigel Hamilton, care conduce Turbo10, un motor de căutare acum defunct care explora Deep Web-ul.
Google și alții asemenea lui nu captează paginile din spatele rețelelor private sau paginile de sine stătătoare care nu se conectează la nimic. Toate acestea sunt parte din Deep Web. Ce se află totuși în aceste adâncuri? Depinde unde ne uităm. Marea parte a Deep Web-ului înmagazinează pagini cu informații vulnerabile. Un raport din 2001 – cel mai bun până în prezent – estimează că 54% din site-uri sunt baze de date. Printre cele mai mari din lume sunt ale National Oceanic and Atmospheric Administration din SUA, NASA, Oficiul de Brevete și Mărci și sistemul de căutare EDGAR al Securities and Exchange Commission (SEC) – toate fiind publice. Următorul lot are pagini păstrate privat de companii care percep o taxă pentru a le vedea, cum ar fi documentele guvernamentale de pe LexisNexis și Westlaw sau revistele academice de pe Elsevier.
Alte 13% din pagini sunt ascunse, deoarece se găsesc doar într-o rețea Intranet. Aceste rețele interne – să spunem, ale corporațiilor sau universităților – au acces la panouri de mesaje, fișiere personale sau panouri de control industriale care pot comuta un întrerupător de lumină sau închide o centrală electrică.
Apoi este Tor, cel mai întunecat colț al Internetului. Este o colecție de site-uri secrete (care au terminația .onion) pentru accesarea cărora ai nevoie de softuri speciale. Tor se folosește pentru ca activitatea de pe Internet să nu poată fi urmărită – rulează pe un sistem releu care trimite semnale către diferite computere Tor din întreaga lume.
SURSA: CNN Money