Las matemáticas de CSI: ¿dónde se va a cometer un crimen?
Todos hemos visto en series procedurales (CSI, Bones, Numb3rs…) como, de repente, algún técnico mediante algún modelo informático predice dónde se va a producir el siguiente crimen, o la zona más probable donde esté el criminal en cuestión. Está claro que son series de ficción pero, ¿qué hay de verdad en esto? ¿Existen modelos matemáticos (que luego se acaban implementando en un ordenador) que permitan estudiar como se comporta el crimen? La respuesta corta es que sí y la larga es este post donde os contaré un modelo matemático de la distribución del crimen basado en las ecuaciones de reacción-difusión.
Una ventana rota sin vigilancia invita a los viandantes a comportarse mal e incluso de manera delictiva. Pronto, una ventana rota se convierte en muchas ventanas rotas y comienza la decadencia del barrio. Pandilleros, borrachos, adictos, prostitutas… es más probable que frecuenten estaciones de tren desatendidas que las que están cuidadas y se patrullan. Al menos, esto es lo que afirmaron (junto con muchos otros ejemplos) Wilson y Kelling en 1982, lo que ahora se conoce como teoría de las ventanas rotas.
Independientemente de las críticas a las que se enfrenta este punto de vista, para físicos y matemáticos es un punto de partida que nos hace pensar en la teoría de la complejidad o en la auto-organización. En estos campos, cambios aparente pequeños a nivel local acaban teniendo consecuencias inesperadas a nivel global con el tiempo. Pero ya no se trata solo de saber si parece que se va a cometer un crimen o no, sino que lo ideal sería cuantificarlo. Saber cuándo, en qué lugar, con qué probabilidad… y si por algo destacan las matemáticas es por cuantificar las cosas. El problema surge en que mucho de lo que se sabe es para cosas lineales, es decir, que cada factor en un sistema tenga una importancia en el resultado que podamos cuantificar directamente, y «por separado». Pero el mundo es muy no lineal (de ahí lo que comentábamos de la teoría de la complejidad), y además los criminales pueden aprender o puede haber retroacción del entorno… ¿Qué hacemos entonces?
El modelo discreto
Una de las primeras aproximaciones al problema es tratarlo como un modelo discreto. Esto no tiene que ver nada con ser sigiloso, sino con la naturaleza de las variables. En estos modelos todo toma valores concretos de manera que entre dos valores consecutivos no haya otro. Por ejemplo, el número de hijos que tiene una persona es una variable discreta (no podemos tener 1.5 hijos). Así, la idea era modelizar el robo a casas, o el allanamiento de morada por ser uno de los casos más sencillos. En este modelo los objetivos, las casas, eran puntos fijos (al contrario de lo que podría pasar con los atracos por la calle) de manera que así nos podemos centrar solo en la dinámica de los ladrones.
¿Qué sabemos a priori de su comportamiento? Podemos suponer que un ladrón no robará demasiado cerca de donde vive por si le reconocen (pero tampoco demasiado lejos) y será en zonas que conoce, quizá porque ya ha hecho alguna fechoría previamente. Traducido al lenguaje matemático esto lo podemos plantear como un camino aleatorio (random walk), simplemente en cada instante de tiempo se moverá en una dirección con ciertas probabilidades preestablecidas. Claro, no será completamente aleatorio por lo que hemos comentado antes, sino que tendrá cierto sesgo, cierta preferencia, hacia unas direcciones (quizá una mansión es más atractiva que una cabaña). Aquí aparece la primera variable. La podríamos considerar como un cierto «atractivo» que dependerá del instante de tiempo y de la zona en la que estemos, ambas variables discretas. Este atractivo irá cambiando con el tiempo, quizá porque el ladrón ya conoce la zona (aumentaría) o porque hay policías (disminuiría). Esto se traduce directamente en la ecuación
$latex A_s(t)=A_s^0+B_s(t)$
Es decir, en cada instante $latex t$ el atractivo $latex A$ en la posición $latex s$ dependerá de un atractivo inicial más cierto sesgo (bias) $latex B$ que depende del tiempo y de la posición. Entonces necesitamos saber la expresión de este sesgo para poder saber el comportamiento de la función de atractivo, y aquí es donde se complica la cosa. Tiene una expresión algo más farragosa pero básicamente depende de factores del tipo cuán atractiva es una zona o cuántos recursos tiene (por si hay que volver). Así, la probabilidad de que un sitio $latex s$ sufra un robo en un tiempo $latex t$ se modeliza como
$latex p_s(t)=1-e^{-A_s(t)}$
de manera que si el atractivo es muy grande eso se aproximará mucho a 1 mientras que si es 0, eso será 0.
Metamos a la biología de por medio
Si ahora dejamos que las variables sean continuas, es decir que puedan tomar cualquier valor en cierto rango (como la altura de una persona) llegamos al modelo continuo. La ventaja de estos modelos es que suelen ser más realistas y dan más información pero también son más complejos de analizar. La ecuación del atractivo de un lugar ahora involucrará derivadas (un objeto matemático que cuantifica el cambio de una variable) con lo que acabamos en el campo de las ecuaciones en derivadas parciales. Concretamente aparecen unas ecuaciones que se encuentran de manera natural en la biología y la bioquímica: las ecuaciones de reacción-difusión. Por ejemplo, sirven para saber como se propaga un fármaco en la sangre y reacciona con ciertos patógenos. Puede parecer sorprendente que algo así tenga que ver con el crimen pero si nos paramos a pensarlo podemos verlo como que los ladrones, o la actividad delictiva, se «difunde por el medio». Efectivamente, si pintamos los resultados en un mapa de un barrio aparecen cosas como:
En esta imagen cuanto más rojo más actividad criminal y cuanto más violeta menos. En la primera fila se han introducido pocos criminales de manera que mediante el modelo anterior tienden a distribuirse más o menos uniformemente pero sin zonas de mucho crimen. Si aumentamos el número de criminales (segunda fila) vemos como ya se crean zonas de actividad criminal más diferenciadas pero acaban siendo transitorias. Finalmente, si el número de criminales es muy alto se acaban autoorganizando (última foto) de manera que hay zonas concretas de mucho crimen (en rojo) y entre medias no es de interés (morado).
Ahora, actuemos
Es decir, ya podemos predecir (con cierta incertidumbre debida a los parámetros que le metamos al modelo) dónde se producirán seguramente los crímenes. Si ahora los buenos de la serie en cuestión van a la zona, ¿qué pasará?
Esto también se ha hecho y es simplemente obligando a que en cierta zona el atractivo sea cero, por ejemplo porque algún agente de ley ha detenido a los miembros de una banda criminal. En el caso de la imagen siguiente nos hemos cargado la actividad criminal del punto del medio de la primera imagen:
Aunque pueden surgir comportamientos emergentes más complejos este es el más común. De izquierda a derecha, al principio están los hotspots del crimen (podríamos pensarlo como bandas callejeras en ciertas zonas concretas) y después suprimimos una de esas bandas. Vemos como alrededor de la supresión se forma un anillo verde, es decir, se ha reducido el crimen (bastante, además) pero fuera todo sigue más o menos igual. Si dejamos correr durante más tiempo la simulación acabaremos observando como todo vuelve a como estaba antes, es decir, es transitorio. Con esto no queda demostrado que las fuerzas de la ley sean inefectivas ni mucho menos, solo que en este caso, debido probablemente a la gran cantidad de zonas con alta criminalidad, la situación «segura» (carente de atractivo) no es una situación estable.
Finalmente, hay también otros modelos que incluyen desorden espacial (aquí el espacio estaba dividido en casillas regulares), métodos para que la supresión policial se adapte a las situaciones que se van creando o análisis más teóricos. Otros modelos incluyen interacciones entre civiles, criminales y guardianes, otros los efectos de la clase socio-económica, de que los ciudadanos se defiendan por sí mismos… En fin, que sigue siendo un campo de estudio bastante fértil.
Así que, para la próxima vez que veas cómo un técnico de CSI indica dónde es más probable que haya un delito recuerda que hay matemáticas detrás. Siempre hay matemáticas detrás.
Referencias:
D’Orsogna M, Perc M. Statistical physics of crime: A review Phys Life Rev (2015)
Pingback:Las matemáticas de CSI: ¿dónde se va a cometer un crimen? | Scire Science
Publicado el 20:02h, 24 febrero[…] Sigue leyendo en Hablando de Ciencia… […]