Raspado (Scraping)

El término «scraping» procede del inglés y significa raspar o reunir. En el ámbito de la ciberseguridad, el scraping se refiere al proceso de recopilación – scraping together – y almacenamiento de datos. Normalmente se trata de datos de sitios web, plataformas o redes sociales.


¿Qué significa en detalle el término «raspado»?

El scraping -la recogida y almacenamiento de datos- puede realizarse básicamente de dos formas:

  • Manualmente, es decir, a mano. Este procedimiento es muy laborioso con grandes cantidades de datos.
  • Automáticamente, por ejemplo mediante programas informáticos. Así se pueden procesar rápidamente incluso grandes cantidades de datos.

Actualmente, el término scraping se utiliza principalmente para la recogida de datos de sitios web. En principio, sin embargo, puede referirse a todos los textos que se muestran en las pantallas. Por ello, a veces se utilizan términos diferentes: por ejemplo, web scraping, screen scraping o data scraping. Sin embargo, todos tienen en común la recogida y el almacenamiento de datos.

El raspado puede utilizarse para varios fines:

  • Para tus propios análisis, por ejemplo para un análisis manual de la competencia.
  • Para recopilar y preparar automáticamente datos de muchos sitios web diferentes.
  • Para la recogida de datos de contacto, por ejemplo direcciones de correo electrónico publicadas en plataformas de medios sociales.
  • Por la copia y publicación no autorizada de contenidos de sitios web de terceros.

¿Dónde me encuentro con el raspado en mi trabajo diario?

Detrás de cada búsqueda con un motor de búsqueda y de cada comparación de precios en línea está el scraping. Los programas de los motores de búsqueda «raspan» incansablemente las direcciones y la información de los sitios web para mostrarlos como resultados de la búsqueda. Al comparar precios, el scraping se utiliza para recopilar precios, imágenes y, en su caso, detalles de los productos.
El scraping también se utiliza con frecuencia en un contexto profesional. Por ejemplo, para analizar a los competidores.

Sin embargo, también puedes encontrarte con el lado abusivo del scraping en tu trabajo diario. Por ejemplo a través de:

  • Un correo electrónico de phishing después de que tu dirección de correo electrónico publicada en el sitio web de la empresa o en LinkedIn, por ejemplo, haya sido raspada.
  • Una empresa que rebaja sistemáticamente tus precios, que lee mediante scaping.
  • Una empresa que ha copiado textos e imágenes de tu sitio web sin tu consentimiento.
  • Sitios web de phishing que han copiado páginas legítimas al detalle mediante scraping, por ejemplo una página de inicio de sesión para banca online.

 

¿Qué puedo hacer para protegerme del raspado abusivo?

  • Ten mucho cuidado cuando compartas tus datos en sitios web y redes sociales. Estos datos pueden ser recogidos, almacenados y transmitidos mediante scraping.
  • Publica la menor cantidad posible de datos que sean de interés para el scraping abusivo. Coloca formularios de contacto en el sitio web de tu empresa, por ejemplo, en lugar de listar direcciones de correo electrónico.
  • Sigue las instrucciones de esta entrada del blog de Perseus para comprobar si ya se han recopilado y publicado datos tuyos o de tu organización mediante scraping.