Una araña web, también llamada rastreador web, indexador web o indizador web, es un programa informático que busca de forma independiente en Internet y analiza los sitios web.
¿Qué significa exactamente el término araña web?
Las arañas web son bots, es decir, programas informáticos que realizan determinadas tareas de forma automática y autónoma. El nombre «araña web» describe la forma en la que funcionan estos bots. Se desplazan de enlace en enlace a través de Internet para así llegar de un sitio web a otro. Los motores de búsqueda utilizan arañas web para analizar las páginas web y «tejer» su directorio. Cada motor de búsqueda utiliza sus propias arañas web. Por ejemplo, Googlebot, Bingbot y las arañas web de otros motores de búsqueda pueden visitar el sitio web de tu empresa.
Las arañas web pueden utilizarse para recoger y analizar automáticamente los datos de los sitios web. Por lo tanto, también se utilizan, por ejemplo, para que los sitios web de comparación de precios encuentren los precios más bajos de determinados productos.
Sin embargo, las arañas web también se utilizan para fines sospechosos o ilegales, como recopilar de forma automática direcciones de correo electrónico a las que luego se les envía spam.
¿En el trabajo diario, dónde puedo encontrarme con el tema de las arañas web?
De manera indirecta, te las encuentras cada vez que utilizas un motor de búsqueda. Los resultados de búsqueda son la manifestación del trabajo de las arañas web. Las direcciones de correo extrañas como «info(arroba)empresa(punto)com» también se deben a las arañas web. Este formato está diseñado para que no puedan leer las direcciones de correo electrónico. Sin embargo, estas direcciones pueden suponer un problema, por ejemplo, para las personas con problemas graves de visión. Además, muchas arañas web no fiables están programadas para reconocer estas grafías alternativas.
¿Qué puedo hacer para mejorar mi seguridad?
Protege las direcciones de correo electrónico accesibles en el sitio web de tu empresa de las arañas web sospechosas. Existen varias opciones para ello, por ejemplo:
- Sustituye las direcciones de correo electrónico por formularios de contacto. Los bots no pueden utilizarlos, pero si son accesibles para los humanos.
- Sustituye las direcciones de correo electrónico por la redirección de URL. Así, la dirección de correo electrónico se vuelve accesible a través de un desvío que no es comprensible para los bots. Ponte en contacto con tu departamento informático para identificar y aplicar las mejores prácticas para tu sitio web.
Artículos relacionados
-
Autenticación de dos factores
La autenticación de dos factores es una protección que se compone de una contraseña y un PIN creados por separado.
mehr lesen -
Vector de ataque
El término vector de ataque designa la ruta y el procedimiento que utilizan los ciberdelincuentes para acceder a un sistema informático, por ejemplo, a través de un correo electrónico (ruta) con un troyano (procedimiento).
mehr lesen