▷ Cómo conseguir contenido web gratis (con pocos escrúpulos)

A poco que echéis un vistazo a ciertos sitios especializados en blogging os encontraréis cómo hay quienes venden artículos ya redactados, que por lo general van en paquetes de la misma temática y que además suelen ser sospechosamente baratos. ¿De donde salen?¿Por qué los escriben previamente sin saber si podrán venderlos? Os voy a contar un secreto: salen de la deep web o internet profunda. Los copian sin que Google lo sepa. Os explico cómo.

Índice de contenidos

¿Qué es la Deep Web?

Deep Web, o Internet profunda, es como se le llama a la parte de Internet que no está indexada por los buscadores convencionales.

Tened en cuenta que Google no rastrea más que una pequeña parte de la Red, y que más allá hay un universo oscuro donde uno puede encontrarse de todo. De hecho, si en alguna ocasión habéis escuchado este término («deep web») probablemente no haya sido por nada bueno, ¿verdad?

La deep web no es más que aquel contenido de Internet que no es accesible por buscadores convencionales.

Eso incluye páginas normales, que es la mayoría de lo que hay; archivos empresariales y, en menor medida, y por lo que más se conoce a esta parte de Internet, temas relacionados con drogas, armas, pasaportes falsos, tarjetas robadas, pornografía extrema, sicarios, terrorismo, redes de servicios secretos y un largo etcétera.

Os dejo un vídeo donde se explica más o menos qué es esto de la Deep Web y sigo comentándoos el asunto de los contenidos:

Buscando sitios web que ya no existen. Vamos al «más allá» de Internet

Hay varias maneras de buscar en la Deep Web, aunque para esta técnica utilizaremos una muy básica (sin tirar de Tor ni gaitas). Vamos a buscar y recorrer webs que ya no existen.

Pues bien, al lío. Lo primero que vamos a hacer es buscar dominios expirados de la temática que nos interese. Para ello hay varios buscadores específicos que rastrean dominios expirados y anulados. Uno de ellos, quizá el más conocido, es Expired Domains. Meteos ahí.

Si no os registráis tendréis a mano las opciones básicas, que son «dominios expirados» y «dominios anulados»; os será suficiente. Si en cambio os da por registraros veréis un montón de opciones adicionales de filtrado: dominios de países (ccTLD), genéricos de alto nivel (gTLD), etc. Sea como sea en un principio no hagáis mucho caso a eso e id al buscador que tenéis en la parte superior derecha de la web. Es decir, aquí:

Imaginad que queremos encontrar artículos sobre perros. Ponéis «perros» en el buscador. Lo que hará el algoritmo es buscar sitios web caducados, anulados o que estén en venta cuya URL coincida con ese parámetro.

Veréis algo como esto:

Ahora lo que tenéis que hacer es buscar entre «lo mejorcito». Para ello hay varias maneras, pero la más práctica es buscando aquellos dominios que tengan más enlaces entrantes. Para ello haced clic en la cabecera de la columna «DP».

Echad un vistazo a las primeras posiciones, ya que serán las webs que más ha enlazado la gente desde diferentes dominios (muy importante, aunque muchas veces sea producto de un linkbuilding salvaje). Esto nos puede dar una idea de qué tan importante era la web, lo que nos será clave para el siguiente paso.

Vamos a seleccionar la segunda opción, que miedo me da investigar la primera…Fijaros en que su estado sea «Available» (disponible). Si véis que está en oferta o con un precio determinado podréis seguir este tutorial, pero aseguraros de que su web no tenga el contenido colocado. Pudiera ser que siplemente esté parkeada en Sedo.

Cómo extraer contenido web que ya no existe

Eso de que ya no existe es un tanto relativo, ya que si bien es cierto que Google ya no lo tiene indexado, y que la propia web ya no existe, no quiere decir que no haya copias en Internet. Para sacar a relucir esta información tenemos un recurso muy bueno: Wayback Machine. Se trata de la cara visible de la ONG norteamericana Internet Archive; una organización que a modo de museo digital va haciendo copias del contenido de las webs del mundo (de las que se rastrean por los buscadores convencionales).

Esas webs que copia, cuando desaparecen, salen de los índices de Google y Bing; quedando el contenido «virgen» en los servidores de Internet Archive.

Hay que tener en cuenta que cuanto más importante es una web, más copian las arañas del Wayback Machine. De ahí que a la hora de seleccionar los dominios expirados hayamos hecho un filtrado y hayamos seleccionado la URL más importante. Bueno, en este caso la segunda más importante.

Aquí el asunto ya es muy sencillo. Coged la URL que habéis conseguido en Expired Domanins y metedla en Wayback Machine. Después os aparecerán las fechas en las que han pasado las arañas de la webapp. Id a los meses donde había más movimiento. Por ejemplo:

En mi caso he seleccionado el 29 de diciembre de 2011. Ahora solo tocará navegar por la web y copiar el contenido. Por ejemplo aquí tenéis un post sobre pitbulls (un poco cutre, todo sea dicho).

Comprobamos si el contenido existe o no en Google

Si alguien quiere usar esos artículos para venderlos en lotes lo suyo es que primero compruebe si realmente están fuera del índice de Google, ya que sí o sí quien los compre lo comprobará.

Hay que tener en cuenta la posibilidad de que la web que hemos seleccionado se haya copiado en su momento los textos de otro sitio.

Hay dos opciones para comprobar esto. La primera es copiando un párrafo del texto y poniéndolo en el buscador. Así, a lo bruto. Si el contenido está en algún sitio lo veréis rápido.

La segunda opción pasa por utilizar un software específico para detectar plagios. Tenéis varias opciones gratuitas. Por ejemplo Plagium.

Contenido gratis para blogs

Esta es una de las maneras que utilizan algunos para obtener contenido gratuito en Internet; otros hacen lo propio para vender paquetes de artículos en conocidos foros. Así pues, si queréis tener un blog de calidad, evitad caer en la tentación de comprar contenido muy económico. Suele haber «cosas raras» detrás.

Cómo conseguir contenido gratis y «original» para un blog (hay que tener pocos escrúpulos)

¿Qué es la Deep Web?

Buscando sitios web que ya no existen. Vamos al «más allá» de Internet

Cómo extraer contenido web que ya no existe

Comprobamos si el contenido existe o no en Google

Contenido gratis para blogs

Deja una respuesta Cancelar la respuesta

Cómo conseguir contenido gratis y «original» para un blog (hay que tener pocos escrúpulos)

¿Qué es la Deep Web?

Buscando sitios web que ya no existen. Vamos al «más allá» de Internet

Cómo extraer contenido web que ya no existe

Comprobamos si el contenido existe o no en Google

Contenido gratis para blogs

Entradas relacionadas

Qué es el «trade marketing»

Ventajas de la omnicanalidad para las PYMEs

Deja una respuesta Cancelar la respuesta