domingo, 23 de noviembre de 2008

Cadenas de correos electrónicos (y matemáticas)

Publicado originalmente el 7 de noviembre de 2007 en mi blog de la Societat Balear de Matemàtiques XEIX.
Hoy he vuelto a recibir otro e-mail para formar una cadena de estas para defender causas muy nobles. Antes de nada decir, por si alguien no se ha dado cuenta, que la mayor parte de estas cadenas no tienen otro objetivo que el de recopilar direcciones electrónicas de gente que después no sabe porqué le llega tanto spam (o cosas peores si uno es tan ingenuo como para abrir los ficheros adjuntos que le llegan en e-mails de gente que no conoce). Ésto está relacionado con lo que en el mundo de los hackers se denomina "Ingeniería social". Muchos ya sabéis que una manera de evitar cadenas de correos electrónicos es borrar del texto las direcciones de toda la gente que lo ha reenviado y reenviarlo como copia oculta (CO)
No me entretendré hablando de estas cadenas que dicen que donaran nosecuántos céntimos por cada vez que se reenvíe un correo porque ya me parece muy fuerte que la gente se crea que hay una superentidad que se dedica a revisar si un e-mail con cierto tipo de contenido se envía y cuántas veces se hace. Y eso por no decir que es totalmente ilegal que alguien pueda acceder al contenido de mis e-mails sin una orden judicial (excepto Bush claro).
Pero desde hace poco comienzo a recibir otro tipo de cadenas. Os explico. Éstas directamente te dicen que cuando lo reenvíes borres las direcciones anteriores y utilices la copia oculta. Como ya he dicho antes, todas suelen tener causas muy nobles y se dedican a hacer listados de firmas a modo de protesta o reinvidicación. Quien ponga su nombre en una determinada posición de la lista tiene que reenviar la lista al origen (para recopilar las listas y poder presentarlas como argumento de fuerza en contra o a favor de la causa).
Analicemos estas cadenas desde un punto de vista matemático. Simplificaremos mucho el problema y supondremos que la persona que escribe el mensaje original es A y que cada persona que reciba el mensaje sigue la cadena y lo reenvía a dos personas (son pocas) que no han recibido el mensaje.
Primera generación:
A
Segunda generación:
AB
AC
Tercera generación:
ABD
ABE
ACF
ACG
Cuarta generación:
ABDH
ABDI
ABEJ
ABEK
ACFL
ACFM
ACGN
ACGO
(todo esto queda más bonito y claro con un árbol, pero...)
En esta generación circulan 8 listas distintas pero todas ellas con miembros comunes (por ejemplo en las dos primeras listas salen A, B y D). Está claro que el número de listas que circulan en la generación "n" es igual a la potencia de base 2 y exponente n-1.
Ahora pensad que el mensaje original dice que quien escriba su nombre en el número 200 devuelva el mensaje a una dirección de correo elecrónico (en teoría la dirección del miembro A).
Tenemos que observar que A recibirá una cantidad de listas que no se corresponde (multiplicada por 200) con la cantidad de gente (sin repetir) que de verdad ha firmado. En esta situación simplificada si llegasen todas las listas de la generación doscientas a A (2 elevado a 199 son muchas listas) aún podríamos saber qué cantidad de gente ha firmado (no es muy difícil encontrar cómo calcular la solución, lo dejo por si alguien quiere pensarlo). Pero en la realidad sabemos que no todos siguen la cadena (por ejemplo yo) y entonces no tenemos una función tan bonita como la exponencial de base 2 (o cualquier otra base) y la cosa es mucho más compleja. Si al miembro original le llegan 1000 listas, ¿cómo puede saber qué cantidad de gente real (sin repetir) está a favor de su causa? Y una cosa tengo clara, no se pondrá a contar la gente revisando una por una las listas.
Sigo pensando que estas cadenas son una tomadura de pelo.

No hay comentarios: