Hace tan solo días que se estrenó la segunda temporada de unas series furor del 2013, House of Cards, la cual es, en mi opinión, la serie que logró propulsar a Netflix como un verdadero contrincante frente a la televisión y otros servicios de streaming como HBO Go o Hulu Plus que apuntan a un público mucho más específico y reducido. Las series originales de Netflix son justamente lo que le dan un increíble valor agregado a la plataforma, y tratando a los usuarios como adultos, permitiéndoles tener de entrada las temporadas completas (las cuales a muchos no les duran ni 24hs, una muy buena señal por cierto).
En muchas de las series actuales, de a poco se ha ido desarrollando la inclusión de temas del momento, que están en boca de todos, y los tecnológicos no podían ser la excepción. Con las empresas de tecnología, servicios online, apps y Bitcoins llegando a los titulares todos los días, ¿por qué no llevarlo a la TV y darle un manto de realidad actual a la trama? El problema es que no todos los guionistas hacen su tarea de investigación correctamente, o simplemente fallan en llevarla a la práctica de manera veraz y precisa, o que deciden terminar haciendo lo que vende, en vez de mostrar la realidad.
Antes de empezar a desarrollar el tema aviso que durante el artículo encontrarán algunos spoilers del segundo episodio de House of Cards. Si están leyendo es porque ya vieron el episodio, van adelantados en la serie, o no les importa HoC pero sí el tema de la deep web. Vamos por partes. Por el minuto 40 del E02, lo vemos a Lucas corrigiendo un artículo de uno de sus redactores, el cual habla de cyberwarfare a operadoras y el posible robo de millones de metadatos de clientes. Y de un momento al otro, la conversación se desvía por la deep web, Tor y hackers, pero, ¿qué tanto de lo escrito en el guión es verídico y cómo es en la realidad?
¿Qué es la deep web y qué tan fácil es acceder a ella?
También conocida como Deepnet, Invisible web o Hidden web, la deep web es una determinada parte de Internet que no es parte de la Surface Web, es decir, aquella que es indexada por los motores de búsqueda estándar. La mejor manera de representar las distintas capas que componen el contenido de Internet es con un océano por ejemplo, ya que el mismo nos da la analogía correspondiente a profundidad y dificultad de acceso a la información.
Lo cierto es que entrar en la deep web es tan sencillo como bajar un archivo y abrir algunos links. La mejor manera es mediante el Tor Browser Bundle, el cual pueden descargar para 32 o 64-bit (también incluso para Android). Tor, o The Onion Router, es una red de túneles virtuales que permiten al usuario mantenerse anónimo y seguro en Internet, básicamente se encarga de enmascarar tu verdadera IP a través de relevos, lo que impiden conocer la localización y dirección IP real del usuario. En el about del proyecto está muy bien explicado y con ejemplos.
La deep web es vulgarmente denominada onionland debido al uso de un tipo de URL especial, los .onion, los cuales son únicamente accesibles a través de Tor. Por ejemplo, este es el link a uno de los sitios que aparecen en el fondo de la notebook de Lucas, The Hidden Wiki:
http://kpvz7ki2v5agwt35.onion/wiki/index.php/Main_Page
¿Cuál es la diferencia entre Tor y I2P?
Durante el episodio en House of Cards, el redactor le dice a Lucas que además de Tor existe I2P, pero que él prefiere Tor sin dudas. Lo cierto es que ambos cumplen la misma función, anonimizar la red, sólo que de distintas maneras.
El que tiene más tiempo de vida es Tor, una ventaja que le permitió ser súmamente estudiado en las comunidades de black hat y white hat. Una de las grandes ventajas de Tor es que tiene detrás del mismo a grandes talentos, como Jacob Appelbaum (de quien recomiendo ampliamente sus charlas en el CCC, sobre todo la última llamada ‘To Protect and Infect, Part 2’), además de contar con un buen número de inversores. En comparación a I2P, Tor realiza una mejor tarea sorteando bloqueos de firewalls estatales (el claro caso de China o Iran) gracias al uso de Transport Layer Security; al ser un proxy tipo SOCKS, el cliente Tor recibe tráfico SOCKS desde nuestras aplicaciones (navegador) y luego, de forma transparente, se encarga de comunicarse con los routers de la red Tor para enviar las peticiones y posteriormente devolvernos los resultados.
Por otra parte, I2P fue pensado para proveer un mejor ambiente para hospedar servicios y no tanto para proveer proxies de salida. Al ser una red completamente distribuida y auto-organizada, I2P está mejor optimizada para los servicios ocultos y no tanto para el usuario promedio que navega por la red. Otra gran diferencia es que I2P esta programada en Java y Tor en C, lo que permite a esta última un mejor uso de los recursos del sistema y velocidad. Lo cierto es que, como siempre, todo se resume a preferencia personal y necesidades, pero claramente, si recién están comenzando a investigar sobre deep web o necesitan anonimato en Internet, Tor es una increíble opción. Si quieren conocer el lado técnico entre Tor vs I2P, les recomiendo este artículo en Null Byte y una comparación en el sitio oficial de I2P.
¿Realmente el 96% de Internet no es accesible a través de los buscadores estándar?
Seguramente lo primero que vean al googlear ‘deep web’ es una -detetestable- imagen de un iceberg, la cual tratan de utilizar como analogía para explicar cómo se compone el contenido de Internet. Si bien en un principio no está mal decir que sólo podemos acceder al 4% de Internet mediante Google, Bing, DuckDuckGo, Yahoo!, etc, la realidad es un poco más compleja que un simple porcentaje.
Los estudios sobre la deep web no abundan. No, no estoy hablando de esos artículos sobre cómo acceder a la misma usando Tor o que enlistan unos simples .onion. Los verdaderos estudios que analizan cómo se compone la deep web son escasos, y los mejores fueron realizados al rededor del 2001, lo que para el ritmo que lleva la tecnología e Internet es mucho tiempo.
¿Por qué es complicado resumirlo en un simple porcentaje? Porque no es sencillo investigar la totalidad de Internet en todos sus niveles, desde la surface web, hasta intranets, darknet, la deep web es un inmenso lugar al que no cualquiera puede transitar como le plazca. Lo que sí es cierto, es que los simples web crawlers que utilizan los motores de búsqueda para indexar sitios no pueden acceder a la misma, y por ello se dice que tan solo un mínimo porcentaje del contenido de Internet es accesible a través de los mismos.
Para que se den una idea, en el año 2000, se estudió que la deep web contenía 7.500 Terabytes de información en comparación a 19 terabytes de la surface web. En este estudio se concluyó que la deep web es 500 veces más grande que la surface web, pero nunca se llega a definir ningún porcentaje, algo que seguramente sea atribución de la prensa y su necesidad de sensacionalismo. Realmente les recomiendo que lean el estudio si quieren comprender mejor cómo se compone internet, los buscadores y la deep web.
Si bien los buscadores estándar no indexan esta red invisible, sí pueden acceder a determinada información de la misma sencillamente con otros buscadores especializados como Infomine, Biblioteca Virtual WWW o Complete Planet, los cuales les pueden ayudar con bastante contenido académico para investigaciones.
¿Es cierto que una gran cantidad de páginas e información de la deep web es basura?
Probablemente esta sea la gran fama que envuelve a la deep web. En el episodio de House of Cards el redactor le dice a Lucas, y parafraseo, «mayormente [la información] es inútil, pero es donde vas a buscar todo, cualquier cosa ,ya sea pornografía infantil, lavado de Bitcoins, compra de narcóticos, contratación de hackers…», ¿qué tan certero es todo esto?
A la pregunta inicial, la respuesta corta es que si, realmente una gran cantidad de información que podemos llegar a encontrar navegando a través de Tor por algunos links .onion es simplemente basura, y es que el problema es que para acceder a información realmente interesante 1) necesitan tener conocimientos para acceder a lugares privados, y 2) saber cómo no ser descubiertos y no dejar huellas si no quieren terminar presos.
Vamos por partes. En la deep web la pronografía abunda, para que se den una idea, todos los subreddits NSFW quedan novatos en comparación. Desde pornografía infantil, zoofilia, parafilia, hasta gore realmente repugnante (como desmembramientos o muertes).
Antes de que el Bitcoin llegue a la plana de los diarios, ya se utilizaba en la deep web para realizar transacciones y comprar drogas, armas, pronografía, etc. Lo del lavado de Bitcoins fue realmente cómico. No es necesario ir a la deep web si necesitan lavar BTCs, una simple googleada les da un buen número de sitios que, mediante comisión, se encargan de dar una nueva billetera con los Bitcoin deseados (luego del pago por la operación). La idea es que no se pueda rastrear los BTC, tu billetera, tu información de cliente, etc, a través del block chain. El problema con el lavado de Bitcoins es que su eficacia depende de la cantidad de usuarios que utilicen el servicio de lavado, lo cual implica una posibilidad de que luego de pasar tus BTCs a otra billetera, recibas los mismos que enviaste. Obviamente, el lavado de Bitcoins es algo que todavía no está demasiado instaurado en la comunidad y todavía se está perfeccionando. ¿Mi recomendación? A menos que confíen en quien está a cargo del servicio, ni se les ocurra ponerlo en práctica.
En cuanto a la compra de narcóticos, seguramente recuerden el caso de Silk Road, el mayor retailer de drogas varias que fue detenido por el FBI con millones de Bitcoins decomisados. Aún quedan algunos mercados, pero probablemente la mayor cantidad de transacciones es realizada entre particulares. Probablemente cuando hablan de contratar asesinos, sicarios o hackers, les suene a película hollywoodense, y en parte están en lo cierto. Estamos en Internet, donde practicamente cualquier niño curioso puede instalar Tor y empezar a jugar en la deep web haciendose pasar por quien quiera. Lo que no quita que haya verdaderos profesionales o expertos que pueden consultar en foros como HackBB y que cobran a base de BTCs, obviamente. Probablemente tengan la misma suerte que encontrando un experto para contratar en una convención como Chaos Communication Congress, DEFCON o eventos de Black Hat.
Internet es un mundo inmenso, lleno de conocimiento con el cual podemos enriquecernos y dar un mayor sentido a nuestra vida. Gracias a increíbles mentes podemos disfrutar de la misma casi libremente, lo ayuda que implica Tor en situaciones como las de China, Iran, Egipto y recientemente Venezuela, es increíble; y los mismos que están detrás de él, luchan contra la NSA a cada rato para protegernos a nosotros mortales de Internet. El artículo podría seguir y seguir, pero quería cubrir lo básico que se habla en el episodio de House of Cards como para dar un paño frío a lo que nos venden en las series. Me encantaría saber sus dudas, sobre todo con lo extenso del tema, si quieren investigar más algo no duden en pedir ayuda en los comentarios.
Deja una respuesta