Is it a fake website?

03 enero 2007

¿Google y peticiones Spam?

Hoy era el primer día de trabajo despues de unos días de vacaciones. Empezamos a revisar que tal va nuestra red. Y al realizar una búsqueda en Google, esto es lo que nos encontramos:

En inglés
y castellano
Decir que estamos en una red con más de 4000 equipos que utilizan nuestros servicios, y todos ellos al realizar una búsqueda en Internet veían este mensaje.

¿Qué es esto?

Lo primero que hicimos, fue mandar un mail a Google indicándoles lo que nos estaba ocurriendo.

En paralelo, buscamos en nuestros equipos estadísticas de tráfico generado. Para ello la herramienta calamaris hizo el trabajo.
Esto es el dato que nos llamó la atención:

-------------------------------------------------------------------------------
# Incoming TCP-requests by host
host request hit-% sec/req Byte hit-% kB/sec
------------------------------ --------- ------ ------- -------- ------ -------
X.X.X.X 15776 0.00 0.66 279081K 0.00 26.78
C.C.C.C 9885 46.80 0.10 71578829 29.55 71.74
A.A.A.A 9865 23.13 1.30 119149K 9.58 9.29
B.B.B.B 8610 7.14 0.37 38128322 3.67 11.67
....
-------------------------------------------------------------------------------

Esos datos se contrastaron con otras estadísticas de días anteriores, y se pudo ver
que el tráfico generado era inusual.
La persona que estaba detrás de esa IP tenía un programa que realizaba búsquedas automáticas en Google a partir de ciertos términos específicados. Con los datos obtenidos generaban estadísticas para investigaciones.

Mientras tanto, en menos de 12 horas, Google respondio a nuestro correo con lo siguiente:

----------------------
Thank you for your note. The captcha page you're referring to is served by
Google when we experience a quick spike in traffic on Google.com. In order
to continue using Google, simply type the squiggly word into the box on
the captcha page. A captcha image helps us determine whether traffic is
coming from automated robot software or individual users, since most
robots aren't smart enough to read the squiggly text. We apologize for any
inconvenience this page may have caused.
-----------------------

Google respondió nuestro mail en menos de 12 horas.
En los términos de servicio de Google, el tercer punto, dice que no permiten las búsquedas automáticas. Esto es lo que nos hizo encontrarnos con las restricicones anteriores.

Cuando Google capta más de 1000 peticiones GET en un corto periodo de tiempo desde la misma IP hace este tipo de restricción, ya que este tipo de patrones se corresponde con tareas automatizadas para recopilar mails, o realizar spam indiscriminado.

Google permite abrir una cuenta especial para estos casos especiales.

Dos conclusiones:

  1. Leer las políticas de uso de los servicios que se utilizan, y respetarlas.
  2. Google tiene un buen soporte a cuestiones de usuarios.

2 comentarios:

Unknown dijo...

Juer que xungo, por cierto, enhorabuena por el ipod de fresqui

Emilio dijo...

Gracias intruso! :-)