Le terme « scraping » vient de l’anglais et signifie gratter ou rassembler. Dans le domaine de la cybersécurité, le scraping désigne le processus de collecte – de grattage – et de stockage de données. La plupart du temps, il s’agit de données provenant de sites Internet, de plateformes ou de réseaux sociaux.
Le scraping – la collecte et le stockage de données – peut en principe se faire de deux manières :
Actuellement, le terme scraping est principalement utilisé pour désigner la collecte de données sur les pages Internet. En principe, il peut toutefois s’appliquer à tous les textes affichés sur les écrans. Différents termes sont donc parfois utilisés : par exemple web scraping, screen scraping ou data scraping. Cependant, leur point commun est toujours la collecte et le stockage de données.
Le scraping peut être utilisé à différentes fins :
Derrière chaque recherche avec un moteur de recherche et chaque comparaison de prix en ligne se cache le scraping. Les programmes des moteurs de recherche « scrapent » inlassablement les adresses et les informations des pages Internet afin de pouvoir les présenter comme résultats de recherche. Dans le cas des comparateurs de prix, les prix, les images et, le cas échéant, les détails des produits sont collectés par scraping.
Le scraping est également très utilisé dans le contexte professionnel. Par exemple, pour l’analyse de la concurrence.
Cependant, vous pouvez également rencontrer le côté abusif du scraping dans votre travail quotidien. Par exemple, par