Crédit image : Franki Chamaki via Unsplash
11.05.2021

(Data) Extraction – Vos données sont mes données

Cybersécurité | Protection informatique | Vecteurs d’attaque

Plus récemment, vous pouvez lire de plus en plus sur les incidents de collecte de données sur Facebook, LinkedIn ou Clubhouse. Mais qu’est-ce qui se cache exactement derrière cette collecte de données ? On va vous le dire.

Qu’est-ce que le (data) scraping ?

Le terme « scraping » vient de l’anglais et signifie quelque chose comme gratter ou gratter ensemble. Le scraping de données désigne une technique par laquelle un programme informatique extrait des données de la sortie lisible d’un autre programme – les rassemble ensemble.

Dans ce scraping, différents types de données sont collectés et stockés très rapidement depuis des sites internet, des plateformes ou des réseaux sociaux. Principalement pour les utiliser plus tard à des fins d’analyse.


Où rencontre-t-on le grattage dans la vie quotidienne ?

Nous rencontrons très souvent des grattages dans la vie quotidienne. Les moteurs de recherche ou les sites de comparaison de prix utilisent le scraping pour collecter et afficher les flux produits, les images, les prix et d’autres détails liés aux produits. Les informations sont recueillies sur de nombreux sites web.

Le grattage est également souvent utilisé dans un contexte professionnel. Par exemple, les scrapers – ceux qui utilisent des outils de scraping – collectent des données auprès de différentes entreprises pour obtenir des informations marketing, le comportement des utilisateurs, les avis produits ou les prix des produits. Cela leur permet d’obtenir des informations sur les concurrents ou de donner à leur propre entreprise un avantage concurrentiel.

Le scraping de données est également réalisé pour obtenir des informations personnelles auprès des employés ou des clients. Par exemple, les coordonnées et adresses, qui sont ensuite vendues à d’autres entreprises. Dans des cas isolés, les cybercriminels peuvent également accéder à ces informations.


Scraping – Légitime ou abusif ?

En général, le scraping collecte des données publiques. Cependant, le facteur décisif réside dans leur utilisation. Les usages légitimes sont, par exemple, les sites de comparaison de prix mentionnés ci-dessus.

Cependant, ces données peuvent également être mal utilisées. Par exemple, en copiant simplement des textes créés professionnellement d’une entreprise et en les utilisant pour d’autres sites web. Ou en envoyant des emails de phishing à des adresses collectées via le scraping. Les cybercriminels peuvent également utiliser le scraping de données pour copier les sites web en détail et les utiliser pour des tentatives de phishing – par exemple, une page de connexion pour la banque en ligne.


Concentrez-vous sur les réseaux sociaux

En ce moment, on parle que plusieurs Cent millions de données personnelles d’utilisateurs ont été publiées et circulent. Ils ont été « scrapés », par exemple, sur le réseau de carrière LinkedIn et sur l’application de réseau social audio Clubhouse.

Peu de temps auparavant, Facebook avait également annoncé qu’il était affecté par le scraping de données. Cela concerne plusieurs centaines de millions de profils.

Cependant, les plateformes concernées ignorent le ne sont pas au courant d’aucune culpabilité, car ces extractions de données ne sont pas des incidents de sécurité causés par des hackers. Seules les données personnelles ont été détournées, auxquelles des tiers peuvent accéder via les applications ou les API publiques – et que les utilisateurs eux-mêmes ont publiées dans leurs profils. Cela inclut des noms, des noms de profil ou des URL de photos.


Données trouvées sur le darknet

Le scraping peut avoir des conséquences négatives pour les personnes concernées – même s’il ne s’agit pas d’une « attaque classique de hacker » dans laquelle des cybercriminels obtiennent un accès non autorisé à des systèmes, serveurs ou réseaux.

Ces derniers jours et semaines, Plusieurs millions de données de profil sont mises en vente sur des forums de hackers bien connus. Dans certains cas, les données étaient même mises à disposition gratuitement. Selon des rapports, des données sensibles telles que les mots de passe ou les informations de carte bancaire n’ont apparemment pas été affectées. Cependant, il est possible que les données publiées soient combinées avec des informations collectées ailleurs, fournissant suffisamment d’informations pour les attaques de fraude (par exemple, phishing, force brute).


Nous recommandons d’accroître l’attention

Si vous avez un profil (ou plusieurs) sur les réseaux sociaux mentionnés, il se peut que vos données soient affectées. C’est pourquoi nous vous conseillons de faire plus attention dans les semaines à venir.

Soyez particulièrement méfiant envers les messages et e-mails suspects, qui pourraient être des tentatives d’utilisation des données collectées pour des fraudes, du phishing ou des attaques d’ingénierie sociale.


Comment pouvez-vous vous protéger ?

En général, il est conseillé de rester attentif à la publication d’informations sur Internet et surtout sur les réseaux sociaux. Ne partagez que le contenu qui permettrait au grand public de le voir. De plus, sachez que vos données seront officiellement partagées avec des tiers. Et qu’elles sont collectées et transmises par des personnes ou, par exemple, par des outils de grattage.

Vous pouvez découvrir comment vérifier si vos données ont été publiées et ce que vous pouvez faire dans ce cas dans cet article de blog.