Crédito de la imagen: Franki Chamaki vía Unsplash
11.05.2021

(Data) Extracción – Tus datos son mis datos

Ciberseguridad | Protección informática | Vectores de ataque

Más recientemente, puedes leer cada vez más sobre incidentes de extracción de datos en Facebook, LinkedIn o Clubhouse. Pero, ¿qué hay exactamente detrás de esta recogida de datos? Te lo contaremos.

¿Qué es el (datos) scraping?

El término «raspado» proviene del inglés y significa algo como raspar o raspar juntos. El extracto de datos se refiere a una técnica en la que un programa informático extrae datos de la salida legible de otro programa, lo que los reúne.

En este extracto, se recopilan y almacenan rápidamente diferentes tipos de datos desde sitios de internet, plataformas o redes sociales. Principalmente para usarlos más adelante con fines de análisis.


¿Dónde encontramos el raspado en la vida cotidiana?

Nos encontramos con el raspado muy a menudo en la vida cotidiana. Los motores de búsqueda o los sitios de comparación de precios utilizan el scraping para recopilar y mostrar feeds de productos, imágenes, precios y otros detalles relacionados con los productos. La información se recopila de muchas páginas web.

El raspado también se utiliza a menudo en un contexto profesional. Por ejemplo, los scrapers —aquellos que utilizan herramientas de scraping— recopilan datos de diferentes empresas para obtener información sobre marketing, comportamiento de usuarios, reseñas de productos o precios. Esto les permite obtener información sobre la competencia o dar a su propia empresa una ventaja competitiva.

El scraping de datos también se realiza para obtener información personal de empleados o clientes. Por ejemplo, datos de contacto y direcciones, que luego se venden a otras empresas. En casos aislados, los ciberdelincuentes también pueden acceder a esta información.


¿Raspado – legítimo o abuso?

Normalmente, el scraping recopila datos disponibles públicamente. Sin embargo, el factor decisivo es cómo se utilizan. Los usos legítimos son, por ejemplo, los sitios de comparación de precios mencionados anteriormente.

Sin embargo, los datos también pueden ser mal utilizados. Por ejemplo, simplemente copiando textos profesionales de una empresa y usándolos para otros sitios web. O enviando correos electrónicos de phishing a direcciones recopiladas mediante scraping. Los ciberdelincuentes también pueden usar la extracción de datos para copiar páginas web en detalle y utilizarlas para intentos de phishing, por ejemplo, una página de inicio de sesión para la banca online.


Céntrate en los canales de redes sociales

En este momento, se comenta que varios Se han publicado y circulan cien millones de datos personales de usuarios. Por ejemplo, fueron «extraídos» en la red de carreras LinkedIn y en la aplicación de redes sociales basada en audio Clubhouse.

Poco antes, Facebook también anunció que se veía afectado por el extracto de datos. Esto es sobre varios cientos de millones de perfiles.

Sin embargo, las plataformas implicadas desconocen la no son conscientes de ninguna culpabilidad, ya que estos extractos de datos no son incidentes de seguridad causados por hackers. Solo se desviaron datos personales, a los que terceros pueden acceder de todos modos a través de las aplicaciones o APIs públicas, y que los propios usuarios han publicado en sus perfiles. Estos incluyen nombres, nombres de perfil o URLs de fotos.


Datos encontrados en la darknet

El scraping puede tener consecuencias negativas para las personas afectadas, incluso si no se trata de un «ataque clásico de hackers» en el que los ciberdelincuentes obtienen acceso no autorizado a sistemas, servidores o redes.

En los últimos días y semanas, Se ofrecen varios millones de datos de perfil a la venta en foros de hackers muy conocidos. En algunos casos, los datos incluso se pusieron a disposición de forma gratuita. Según los informes, datos sensibles como contraseñas o información de tarjetas de crédito aparentemente no se vieron afectados. Sin embargo, existe la posibilidad de que los datos publicados se combinen con información recolectada en otros lugares, proporcionando suficiente información para ataques de fraude (por ejemplo, phishing, fuerza bruta).


Recomendamos una mayor atención

Si tienes un perfil (o varios) en las redes sociales mencionadas, puede que tus datos se vean afectados. Por ello, te aconsejamos que prestes más atención en las próximas semanas.

Sé especialmente desconfiado de los mensajes y correos electrónicos sospechosos, que podrían ser intentos de utilizar los datos recopilados para fraude, phishing o ataques de ingeniería social.


¿Cómo puedes protegerte?

En general, es recomendable estar atento a la publicación de información en Internet y, especialmente, en las redes sociales. Solo comparte el contenido que permita al público general verlo. Además, ten en cuenta que tus datos serán compartidos oficialmente con terceros. Y que se recogen y transmiten por personas o, por ejemplo, a través de herramientas de raspado.

Puedes averiguar cómo comprobar si tus datos han sido publicados y qué puedes hacer en este caso en este artículo del blog.