Deep Web: conheça o submundo da Internet


Saiba como obter acesso a um conteúdo que pode ser até 500 vezes maior do que o Google é capaz de lhe mostrar!

Você já deve ter se deparado com esta analogia cafona um sem-número de vezes: "a internet é como um oceano". Sim, a internet é um verdadeiro oceano de informações, cultura e entretenimento. E, para navegar neste oceano e ter acesso a tudo o que ele é capaz de oferecer, nos tornou reféns dos chamados motores de busca (Search engine); mais precisamente, do mais famoso deles, o Google.
Porém, ao contrário do que muitos pensam e por razões que fogem ao conhecimento da maior parte dos internautas, o Google, e outros mecanismos de busca populares, não são capazes de lhe mostrar exatamente tudo o que existe na rede mundial de computadores.

Na verdade, mecanismos como o Google, o Bing e o Yahoo são capazes de lhe mostrar apenas o que há na superfície deste oceano, ou seja, uma parte muito pequena do que realmente é a Internet.


Exagero? Nem um pouco...
Para se ter uma ideia melhor do quão superficial é sua experiência na Web ao utilizar um desses mecanismos de busca, vamos apresentar um dado realmente impressionante: um estudo feito pela Universidade da Califórnia no ano de 2001, estimou que toda a Internet apresentada pelos mecanismos de busca corresponde a bem menos de 1% do tamanho real. A conclusão é que a "internet invisível" é entre 400 e 550 vezes maior do que estes mecanismos nos fazem crer.

A falta de indexação de todo este conteúdo nos motores de busca populares ocorre por inúmeras razões:

  • Determinação do dono do conteúdo: existem algumas 'metatags' (tipo de instrução HTML) que podem ser usadas no cabeçalho de um site para instruir os mecanismos de busca a não indexar seu conteúdo, tornando-os, desta forma, inacessíveis ao grande público.
  • Violação de algum termo de indexação: os mecanismos de busca podem deixar de indexar um site se o mesmo infringir algumas de suas regras. Por exemplo, um sitemap1 mal feito.
  • Dificuldade de acesso ao conteúdo dinâmico: A maior parte das informações da Web está enterrada muito abaixo das páginas geradas de maneira dinâmica. Motores de busca tradicionais criam seus índices rastreando páginas de "superfície". Para serem descobertas, as páginas devem ser estáticas e ligadas a outras páginas. Motores de busca tradicionais não conseguem "ver" ou recuperar este conteúdo já que, tecnicamente, não existem até que sejam criados dinamicamente conforme o resultado de uma pesquisa específica. Ou seja, indexadores de mecanismo tradicionais não podem sondar abaixo da superfície.
  • Efeito "publicidade": Com o intuito de "melhorar" a exibição de publicidade, os desenvolvedores dos motores de busca mais populares têm investido pesadamente na personalização dos resultados. Para tanto, são usados diversos artifícios: desde simples cookies de sessão até associação com serviços de e-mail e redes sociais que, literalmente, leem suas mensagens em busca de palavras que possam ser relacionadas a propaganda personalizada. 

A ideia é tentar, a todo custo, identificar seus hábitos de uso para poder exibir a publicidade que melhor se encaixa em seu perfil pessoal.

Para se ter uma ideia de como estão as coisas hoje em dia, duas pessoas distintas que fazem uso assíduo de redes sociais, costumam fazer determinados tipos de pesquisa com frequência, nunca apagam cookies do navegador e, principalmente, permanecem logadas com nome de usuário e senha a estes mecanismos e seus respectivos servidores de e-mail, certamente não receberão o mesmo resultado de pesquisa para um termo qualquer que for digitado. Ou seja, o mecanismo de busca não estará exibindo, como inicialmente você poderia imaginar todos os resultados para seu termo de busca, mas sim os resultados que ele "entende que sejam os melhores para você"! Isso faz com que boa parte dos resultados para sua pesquisa permaneça inacessível.

Um mesmo termo de busca no Google pode gerar resultados diferentes para diferentes perfis de pessoas. Na imagem, é visível a diferença entre os Screenshots tirados por duas pessoas diferentes.

  • Conteúdo "Proibido": Muitos sites são automaticamente ignorados ou 'desindexados' pelos mecanismos por apresentarem conteúdo ofensivo ou potencialmente perigoso. Nesta categoria, encaixam-se redes criminosas de todos os tipos como sites de terroristas, de nazistas, de pedófilos e de incentivo a violência por discriminação. Sites de hackers, crackers e de compartilhamento de malwares de todos os tipos também se encontram abaixo da superfície da internet visível. Sites com conteúdo hediondo, como muitos sites nazistas, de sociedades satânicas e de diversos tipos de bizarrices como zoofilia, necrofilia e snuff também fazem parte do conteúdo "inacessível".
A besta tem 7 nomes...

Abaixo da superfície (Surface Web), existe uma internet totalmente desconhecida pelo usuário comum. Este mundo submerso e misterioso é, normalmente, mencionado através dos seguintes termos:

1. Deep Web (Web Profunda);
2. Deep Net (Rede Profunda);
3. Invisible Web (Web Invisível);
4. Under Net (Abaixo da Rede);
5. Hidden Web (Web oculta);
6. Dark Net (Rede sombria);
7. Free Net (Rede Livre)

Fazer uma busca por estes termos no Google irá lhe trazer bastante informação útil, mas não vai levar você muito além do nível "água no joelho". Para acessar o conteúdo profundo é necessário usar escafandro e ficar muito esperto com os monstros abissais que certamente irão se apresentar.

Até onde vai a toca do coelho?

Se você chegou até este ponto da matéria, certamente já deve ter percebido que os mecanismos de busca tradicionais não irão lhe ajudar muito a desvendar o conteúdo oculto da internet. Mas não é só isso: os navegadores também não!

Na verdade, a Deep Web é um território "perigoso", onde o risco de contaminar-se com um vírus ou ter o computador invadido por hackers e crackers é muito maior. Além disso, boa parte do conteúdo está encriptado, o que requer ferramentas diferentes para acessá-lo. Por isso, navegadores comuns irão restringir automaticamente determinados tipos de conteúdo ou simplesmente não vão carregá-los pois, em sua maioria, estão repletos de miniaplicativos e add-ons que visam "garantir" sua segurança: filtros anti-phishing, anti-popup, níveis de segurança por zona, etc.

Sendo assim, a melhor forma de começar a desbravar este território inóspito é esquecer a forma tradicional de acesso, fugindo de ferramentas populares e se precavendo ao máximo!

Utilizar uma máquina virtual, ao invés dos recursos nativos do seu computador, é uma boa ideia. Assim, se algo acontecer, basta deletar a máquina virtual e nada de importante será perdido. Tudo de ruim que puder vir a ocorrer (infecção por vírus, invasão por rootkit, etc., só irá contaminar a máquina virtual). Outra vantagem de se recorrer às máquinas virtuais é que você não vai ficar paranoico com instalação e configuração de programas antivírus, firewalls, anti-spywares, etc. Afinal de contas, fazendo desta forma, tudo o que é importante vai ficar inacessível e bem longe do alcance dos perigos do mundo Deep.
 
Sobre máquinas virtuais
Existem alguns programas capazes de "emular" um PC inteiro dentro de uma janela do Windows (ou de outro sistema operacional). Você literalmente roda dois sistemas operacionais distintos simultaneamente em um mesmo computador.

Para saber mais sobre o assunto, visite:
http://www.superdownloads.com.br/materias/melhor-virtualizador-virtualbox-vmware-virtual-pc.html

Após instalar a máquina virtual, o próximo passo é, literalmente, mergulhar dentro da Deep Web.

The Onion Router (ou simplesmente Tor)
A navegação anônima é a sua principal ferramenta para desbravar o conteúdo da Deep Web. A primeira razão para navegar desta forma é que fica um pouco mais difícil para hackers e sites com conteúdo nocivo efetuarem um ataque direto contra seu computador. A segunda razão é que, dependendo do que você for visitar, existe a possibilidade de você ser redirecionado para sites com conteúdo criminoso. Portanto, navegar sem a proteção do anonimato, pode colocá-lo na mira de organizações de investigação criminal de todo o mundo.

Existem inúmeras ferramentas que podem ser instaladas em seu computador para a navegação anônima. Porém, uma das melhores é o Tor.

O Tor (https://www.torproject.org/) é, na verdade, uma rede de computadores que visa prover anonimato através de túneis HTTP e roteadores que funcionam a partir de máquinas de usuários comuns conectadas à internet e que rodam uma versão servidor da aplicação.

Para navegar dentro desta rede, é necessária a instalação da versão cliente do programa para que seja criado um proxy que se conecta a ela. Feito isso, navegadores e programas que se conectam à internet (Internet Explorer, Emule, Bittorrent, etc.) devem ser configurados para usar um servidor do tipo "proxy socks 5" com endereço de destino no próprio computador, ou seja, IP 127.0.0.1. Em sua maioria, programas que fazem uso da internet possuem abas de configuração onde é possível fazer este tipo de modificação.

A partir de então, o Tor roteia todo o tráfego da conexão do cliente através dos túneis da rede até o destino desejado. Desta forma, se o usuário visitar um site do tipo http:\\meuip.com.br (que serve para identificar seu IP na internet), vai receber uma resposta diferente do IP real do computador. O IP apresentado será, no caso, o endereço IP do nó Tor por onde o tráfego de rede "saiu" para acessar o conteúdo da "rede convencional".

Para quem quer fazer uma pesquisa do próprio IP, outros IP's e domínios nossa leitora Vivian Bermudez ( obrigada pela colaboração ) sugeriu a ferramenta pt.vpnmentor.com que tem um design bem agradável e é muito simples de utilizar

A rede Tor possui uma topologia bastante caótica e você não tem como saber qual IP será destinado a sua navegação ou a que parte do mundo tal IP pertence.
“Além disso, existe um tipo de domínio com extensão .onion" que é acessível apenas pelos clientes Tor. 

Aliás, foi a partir dos sites ".onion" que nasceu a expressão "Deep Web". Tentar acessar tais sites por um navegador comum irá resultar em erro.
Links para sites da Deep Web são parecidos com estes:
http://kpvz7ki2v5agwt35.onion
(The Hidden Wiki - Contém toneladas de informações sobre sites Tor)

http://xmh57jrzrnw6insl.onion
(Motor de busca para sites Deep Web)
http://eqt5g4fuenphqinx.onion
(Pesquisa em diretório dentro da Internet profunda)
http://jhiwjjlqpyawmpjx.onion
(Tormail, gratuito para envio de mensagens anônimas) 
http://4eiruntyxxbgfv7o.onion
(Mensagens instantâneas anônimas)
http://eqt5g4fuenphqinx.onion/
(Core .onion, pesquisa em diretório)

Existem sites na Deep Web (“.onion") que abordam os mais variados tipos de assunto: desde treinamento de guerrilha e armamentos até lojas virtuais de drogas e outros itens ilegais. O conteúdo é vasto, chocante e, muitas vezes, indigesto! Por razões "óbvias", exibimos apenas os links acima para que você possa iniciar sua jornada.

Navegador Tor
Felizmente, existe uma maneira mais fácil de desbravar a Deep Web através do Tor, sem a necessidade de configurações complicadas. Tudo o que você precisa se resume ao Tor Browser .

Fique ciente, porém, que a navegação através dele é lenta. O motivo é a já mencionada e intrincada rede de túneis que são gerados para lhe garantir o anonimato.

Outras fontes interessantes
Deixando um pouco de lado o conteúdo "sombrio", apresentamos algumas fontes interessantes que podem levá-lo além do que o Google é capaz de lhe mostrar. Com estes mecanismos, a "água vai até a cintura”.
1. DeepPeep: Serviço idealizado para gerar resultados não captados por motores de busca comuns. Ainda em fase beta, portanto, pode apresentar problemas.
2. MetaCrawler: Exibe, em sua tela de resultados, uma pesquisa conjunta em vários mecanismos de busca tradicionais. A vantagem é que você não fica limitado aos resultados de pesquisa personalizados que mencionamos anteriormente, além, é claro, de receber muito mais informação por termo digitado.
3. Oth.net: Motor de busca especializado em procurar por arquivos em servidores FTP do mundo todo. Tem, literalmente, de tudo.
4. Duck Duck Go: Para quem leva teoria da conspiração a sério e torce o nariz para utilizar serviços de empresas como Google, Yahoo e Microsoft, o Duck Duck Go é uma boa alternativa para ser usado como mecanismo de busca principal.
5. InfoMine: Motor de busca desenvolvido por um grupo de bibliotecas Norte Americanas, dentre elas a da Universidade da Califórnia e da Universidade de Detroit. Lá você encontra muita informação interessante, como periódicos eletrônicos, livros, boletins, listas de discussão, catálogos de bibliotecas on-line, artigos, diretórios de cientistas e pesquisadores, etc.
6. The Virtual Library: É considerado um dos mais antigos catálogos da Web. Foi desenvolvido por alunos de Tim Berners-Lee, o próprio criador da Web. A caixa de pesquisa funciona como um motor de busca tradicional. Divirta-se!
7. Complete Planet: Um dos melhores buscadores não-populares. Nele, você encontra uma variedade realmente grande de assuntos que vão desde comidas e bebidas até assuntos militares.
8. Infoplease: Um buscador para enciclopédias, almanaques, atlas e biografias em geral

Considerações finais
A Deep Web é realmente um assunto muito vasto. Infelizmente, é necessário bastante conhecimento em outras línguas para poder fazer uso de todo seu potencial e, para mantermos a matéria em um nível mínimo de legalidade, não pudemos abordar alguns tópicos realmente polêmicos e extremamente difundidos nas profundezas da Internet. Mas esperamos que, com as informações passadas aqui, você possa aumentar exponencialmente sua cultura e conhecimento sobre este mundo louco em que vivemos. E tudo está lá, nas profundezas... É só procurar!

Bom mergulho!

1. Sitemap é uma representação hierárquica da estrutura de um site.

Fonte:  superdownloads