Cómo evitar el raspado del contenido del blog en WordPress

Cómo evitar el raspado del contenido del blog en WordPress

¿Está buscando una manera de evitar que los spammers y los delincuentes roben el contenido de su blog de WordPress utilizando raspadores de contenido? Es muy frustrante como propietario de un sitio web que alguien robe su contenido sin permiso, lo monetice, lo supere en Google y le robe su audiencia. En este artículo, cubriremos qué es el scraping de contenido de blogs, cómo puede reducir y prevenir el scraping de contenido e incluso cómo aprovechar el scraping de contenido para su propio beneficio.

Cómo evitar el raspado de contenido en WordPress

¿Qué es el scraping de contenido de blogs?

Contents

El raspado de contenido de blog es cuando el contenido se extrae de muchas fuentes y se vuelve a publicar en otro sitio. Por lo general, esto se hace automáticamente a través de la fuente RSS de su blog. El raspado de contenido es tan fácil ahora que cualquiera puede iniciar un sitio de WordPress, poner un tema gratuito o comercial e instalar algunos complementos que tomarán contenido de blogs seleccionados.

¿Por qué los raspadores de contenido roban mi contenido?

Algunos de nuestros usuarios nos han preguntado por qué están robando mi contenido. La respuesta simple es: eres increíble. La verdad es que estos raspadores de contenido tienen motivos ocultos. Aquí hay algunas razones por las que alguien destruiría su contenido:

  • Comisión de afiliados - Hay afiliados sucios que solo quieren explotar el sistema para ganar unos dólares extra. Utilizarán su contenido y el contenido de otros para dirigir el tráfico a su sitio a través del motor de búsqueda. Estos sitios generalmente están dirigidos a un nicho específico, por lo que tienen productos relacionados que promocionan.
  • Generación líder - A menudo vemos a abogados y agentes inmobiliarios haciendo esto. Quieren aparecer como líderes de la industria en sus pequeñas comunidades. No tienen el ancho de banda para producir contenido de calidad, por lo que salen y obtienen contenido de otras fuentes. A veces ni siquiera son conscientes de esto, ya que pagan $ 30 al mes para agregar contenido y ayudarlos a obtener un mejor SEO. Hemos conocido a varios de ellos en el pasado.
  • Ingresos por publicidad - Algunas personas solo quieren crear un "centro" de conocimiento. Ventanilla única para usuarios de un nicho específico. A menudo notamos que el contenido de nuestro sitio se está rayando. El raspador siempre responde, estaba haciendo esto por el bien de la comunidad. Excepto que el sitio está plagado de anuncios.

Estas son solo algunas de las razones por las que alguien robaría su contenido.

¿Cómo detectar raspadores de contenido?

La captura de raspadores de contenido es una tarea tediosa y puede llevar mucho tiempo. Hay algunas formas de capturar raspadores de contenido.
Busca en Google con los títulos de tus publicaciones
Sí, es tan doloroso como parece. Es probable que este método no valga la pena, especialmente si está escribiendo sobre un tema muy popular.
Trackbacks
Si agrega enlaces internos a sus publicaciones, notará un trackback si un sitio roba su contenido. De esta manera, el raspador le dice que está raspando su contenido. Si está utilizando Akismet, muchos de estos trackbacks aparecerán en la carpeta SPAM. Nuevamente, esto solo funcionará si tiene enlaces internos en sus publicaciones.
Ahrefs
Si tiene acceso a una herramienta de SEO como Ahrefs, puede monitorear sus vínculos de retroceso y estar atento al contenido robado.

Cómo administrar los raspadores de contenido

Hay pocos enfoques que las personas adoptan cuando se trata de recopiladores de contenido: el enfoque de no hacer nada, el enfoque para llevar o el enfoque para aprovecharlos. Echemos un vistazo a cada uno de ellos.
El enfoque de no hacer nada
Este es, con mucho, el enfoque más fácil que puede adoptar. Por lo general, los bloggers más populares lo recomendarían porque lleva MUCHO tiempo abordar los raspadores. Ahora, obviamente, si es un blog conocido como Smashing Magazine, CSS-Tricks, Problogger u otros, entonces no tienen que preocuparse por eso. Son sitios de autoridad a los ojos de Google. Sin embargo, conocemos algunos buenos sitios que fueron marcados como scrapers porque Google pensó que sus scrapers eran el contenido original. Por lo tanto, este enfoque no siempre es el mejor en nuestra opinión.
Enfoque de arriba hacia abajo
Esto es exactamente lo opuesto al enfoque de "no hacer nada". En este enfoque, todo lo que necesita hacer es contactar al raspador y pedirle que elimine el contenido. Si se niegan a hacerlo o simplemente no responden a sus solicitudes, presenta una DMCA (Ley de derechos de autor del milenio digital) con su anfitrión. En nuestra experiencia, la mayoría de los sitios web de scraping no tienen un formulario de contacto disponible. Si es así, utilícelo. Si no tienen el formulario de contacto, debe realizar una búsqueda Whois.
Búsqueda de Whois
Puede ver la información de contacto en el contacto administrativo. Por lo general, el contacto administrativo y técnico es el mismo. También mostrará el registrador de dominios. La mayoría de las empresas de alojamiento web y los registradores de dominios más conocidos tienen formularios o correos electrónicos DMCA. Puede ver que esta persona específica está con HostGator debido a sus servidores de nombres. HostGator tiene un formulario para quejas de DMCA. Si el servidor de nombres es algo así como ns1.theirdomain.com, debe profundizar más realizando búsquedas de IP inversas y buscando direcciones IP. También puede utilizar un servicio de terceros para DMCA.com para retiros. Jeff Starr en su artículo sugiere que debería bloquear las direcciones IP de los malos. Acceda a sus registros para obtener su dirección IP, luego bloquéelo con algo como esto en su archivo raíz .htaccess: Deny from 123.456.789 También puede redirigirlos a un flujo ficticio haciendo algo como esto: RewriteCond% {REMOTE_ADDR} 123 . 456 .789 . RewriteRule. * Http://dummyfeed.com/feed [R,L] Puede ser realmente creativo aquí, como sugiere Jeff. Envíelos a flujos de texto realmente grandes llenos de Lorem Ipsum. Puedes enviarles imágenes repugnantes de cosas malas. También puede enviarlos directamente a su propio servidor, lo que provocará un bucle infinito que bloqueará su sitio. El último enfoque que tomamos es aprovecharlo.

Cómo aprovechar los raspadores de contenido

Este es nuestro enfoque para lidiar con los raspadores de contenido, y va bastante bien. Ayuda a nuestro SEO y nos ayuda a ganar dinero extra. La mayoría de los raspadores utilizan su fuente RSS para robar su contenido. Así que estas son algunas de las cosas que puede hacer:

  • Enlace interno - Tienes que vincular mucho las publicaciones de tu blog. Cuando tiene enlaces internos en su artículo, lo ayuda a aumentar las páginas vistas y reducir la tasa de rebote en su propio sitio. En segundo lugar, le permite obtener vínculos de retroceso de las personas que roban su contenido. Finalmente, te permite robar su audiencia. Si eres un bloguero talentoso, entiendes el arte de los enlaces internos. Tienes que colocar tus enlaces en palabras clave interesantes. Haga que el usuario se sienta tentado a hacer clic en él. Si hace esto, la audiencia del raspador también hará clic en él. Así, llevó a un visitante a su sitio y lo llevó de regreso a donde debería haber estado en primer lugar.
  • Vincular automáticamente palabras clave con enlaces de afiliados - Hay pocos complementos como ThirstyAffiliates que reemplazarán automáticamente las palabras clave asignadas por los enlaces de afiliados,
  • Sea creativo con el pie de página RSS - Puede utilizar el plugin All in One SEO para agregar elementos personalizados a su pie de página RSS. Puede agregar prácticamente cualquier cosa que desee aquí. Conocemos a personas a las que les gusta promocionar sus propios productos entre sus lectores de RSS. Por lo tanto, agregarán pancartas. Adivina qué, ahora estos banners también aparecerán en el sitio web de estos raspadores. En nuestro caso, siempre agregamos un pequeño descargo de responsabilidad al final de nuestros artículos en nuestros canales RSS. Al hacer esto, obtenemos un enlace al artículo original en el sitio de scraper que le permite a Google y otros motores de búsqueda saber que somos una autoridad. También les permite a sus usuarios saber que el sitio está robando nuestro contenido.

Consulte nuestra guía sobre cómo controlar el pie de página de su fuente RSS en WordPress para obtener más consejos e ideas.

Cómo reducir y prevenir el scraping de blogs de WordPress

Mientras que si adopta nuestro enfoque de muchos enlaces internos, agregando enlaces de afiliados, banners RSS y oportunidades como esas, reducirá en gran medida el raspado de contenido. Si acepta la sugerencia de Jeff Starr de redirigir los raspadores de contenido, eso también detendrá esos raspadores. Además de lo que hemos compartido anteriormente, hay algunos otros consejos que puede utilizar.

Feed RSS completo o resumido

Ha habido cierto debate en la comunidad de blogs sobre si se debe tener una fuente RSS completa o una fuente RSS resumida. No entraremos en los detalles de esta discusión, pero uno de los beneficios de tener un feed RSS de solo resumen es que evita el raspado de contenido. Puede cambiar la configuración yendo a su panel de administración de WordPress y yendo a Configuración »Lectura. A continuación, modifique la configuración de cada artículo de un número de noticias en tiempo real: Resumen.

Spam de trackback

Los trackbacks y pingbacks ciertamente han tenido grandes usos, pero ahora se abusa de ellos constantemente. Los temas suelen mostrar trackbacks y pingbacks debajo o entre los comentarios. Esto engaña al spammer para que raye tu sitio y envíe trackbacks. Si lo aprueba por error, obtienen un vínculo de retroceso y una mención de su sitio. A continuación, se explica cómo desactivar los trackbacks en todos los artículos futuros. Aquí hay un artículo que le mostrará cómo deshabilitar los trackbacks y pings en publicaciones existentes de WordPress.

Es...

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir