Scraping

¿Qué se entiende por scraping?

El término «scraping» viene del inglés y significa raspar o arañar. En el ámbito de la ciberseguridad, el scraping se refiere al proceso de recopilación y almacenamiento de datos. En la mayoría de los casos, se trata de datos procedentes de sitios web, plataformas o redes sociales.

 

¿Qué significa exactamente el término scraping?

El scraping (la recopilación y almacenamiento de datos) puede realizarse básicamente de dos maneras:

  • De forma manual, cuyo procedimiento se vuelve muy laborioso cuando se trabajan grandes cantidades de datos.
  • De forma automática, por ejemplo, mediante un programa. De esta manera, se pueden procesar rápidamente incluso grandes cantidades de datos.
  • En la actualidad, el término scraping se utiliza principalmente para la recogida de datos de sitios web, aunque también puede referirse a todos los textos que se muestran en las pantallas. Por lo tanto, en algunos casos se suelen utilizan términos diferentes, como web scraping, screen scraping y scraping de datos. Sin embargo, todos tienen en común la recogida y el almacenamiento de datos.

El scraping puede realizarse con diferentes fines:

  • Para análisis propios, por ejemplo para un análisis manual de la competencia.
  • Para la recopilación y preparación automática de datos de muchos sitios web diferentes.
  • Para la recopilación de datos de contacto, por ejemplo, direcciones de correo electrónico publicadas en plataformas de redes sociales.
  • Para copiar y publicar de forma no autorizada contenidos de otros sitios web.

 

¿En el trabajo diario, dónde puedo encontrarme con scraping?

Puedes encontrarlo al buscar en internet y al comparar precios en línea. Los motores de búsqueda utilizan el scraping de forma constante para recopilar las direcciones y la información de las páginas web y así poder presentarlas como resultados de búsqueda. Para las comparaciones de precios, los precios, las imágenes y, en su caso, los detalles de los productos también se recogen mediante scraping.  El scraping también se utiliza con frecuencia en el contexto profesional, por ejemplo, para un análisis de la competencia.

Sin embargo, también puedes encontrar el lado abusivo del scraping en el trabajo diario, por ejemplo, a través de:

  • Un correo electrónico de phishing después de que hayan recopilado tu dirección de correo electrónico publicada, por ejemplo, en el sitio web de tu empresa o en LinkedIn.
  • Una empresa que sistemáticamente rebaja los precios que recopila.
  • Una empresa que ha copiado textos e imágenes de tu sitio web sin tu consentimiento.
  • Sitios web de phishing que han copiado con todo detalle páginas web reales mediante scraping, por ejemplo, una página de acceso a la banca online.

 

¿Qué puedo hacer para protegerme del scraping?

  • Ten mucha precaución a la hora de compartir tus datos en sitios web y redes sociales, ya que pueden recogerse, almacenarse y compartirse mediante scraping.
  • Publica la menor cantidad posible de datos que sean interesantes para el scraping abusivo. Por ejemplo, crea formularios de contacto en el sitio web de la empresa en lugar de ofrecer diferentes direcciones de correo electrónico.