viernes, 30 de agosto de 2013

El caso Lucia de Berk

http://www.historiasdelaciencia.com/

A través del libro Mala ciencia de Ben Goldacre me entero de lo que sucedió con una enfermera en Holanda llamada Lucia de Berk. Lo sucedido es un ejemplo más de lo que ha venido a conocerse como la “falacia del fiscal” de la que ya os hablé en su día con otros ejemplos. No obstante, Goldacre nos da una mejor explicación cuando corría el año 2010.
Se puede tener muy mala suerte de veras. Una enfermera llamada Lucia de Berk lleva seis años presa en Holanda, condenada por siete delitos de asesinato consumados y tres en grado de tentativa. Durante su turno de servicio, falleció un número inusitadamente elevado de personas, y eso, esencialmente, unido a alguna que otra prueba circunstancial muy débil, es lo que conforma la sustancia de la acusación que la llevó a la cárcel. Jamás ha confesado, sigue proclamando su inocencia y su juicio ha generado un amplio número de artículos teóricos en las publicaciones especializadas en estadística.
La sentencia se basó fundamentalmente en una cifra: la de una probabilidad entre 342 millones de que la acusada fuera inocente. Incluso aunque halláramos errores en el cálculo de esa probabilidad (y créanme que los hallaremos), como ya ocurrió en nuestra historia anterior, la cifra en sí continuaría siendo prácticamente irrelevante. Y es que, como ya hemos mencionado en reiteradas ocasiones, lo interesante de la estadística no son los complicados cálculos matemáticos, sino lo que esos números significan.
Hay también una importante lección que todos podemos extraer de este caso para nuestro propio beneficio: los sucesos improbables ocurren. Siempre hay alguien que gana la lotería cada semana, y niños a los que les alcanza un rayo. Nada de esto es extraño y sorprendente salvo cuando sucede algo muy, muy específico e improbable después de haberlo predicho.
La que sigue es una analogía.
Imaginemos que estoy en las inmediaciones de un enorme granero de madera armado con una imponente ametralladora. Me vendo los ojos y —riéndome a grandes carcajadas como un maníaco— disparo miles y miles de balas contra una pared del granero. Luego arrojo el arma al suelo, me acerco caminando hasta la pared en cuestión y la examino detenidamente durante un tiempo, toda ella, por arriba y por abajo. Entonces, doy con un lugar en el que descubro tres agujeros de bala muy próximos entre sí, dibujo una diana a su alrededor y anuncio orgulloso que soy un excelente tirador.
Supongo que ustedes no estarían de acuerdo con mis métodos ni con las conclusiones de esa deducción. Pero eso fue exactamente lo que sucedió en el caso de Lucia: los fiscales encontraron siete muertes en el turno de una de las enfermeras y en un mismo hospital, ciudad, país y planeta, y luego trazaron una diana en torno a ellas.
Eso infringe una regla fundamental de toda investigación con estadísticas: no se puede buscar la hipótesis en los resultados. Antes de acudir a los datos con la herramienta estadística que pretendamos utilizar, necesitamos contar con una hipótesis concreta que contrastar. Si nuestra hipótesis procede del análisis de unos datos, entonces no tiene sentido alguno analizar los mismos datos de nuevo para confirmarla.
Ésa es una forma bastante compleja, filosófica y hasta matemática de lo que se llama un argumento circular. Pero en el caso que aquí les refiero también hubo formas mucho más concretas de razonamiento circular. Para recopilar más datos, los investigadores volvieron a las salas del hospital en busca de más muertes dudosas. Pero todas las personas a las que preguntaron si recordaban algún incidente sospechoso sabían que les estaban haciendo aquellas preguntas porque Lucia podía ser una asesina en serie. Existía un riesgo elevado de que el concepto mismo de incidente sospechoso se vinculara de inmediato (como sinónimo) a la idea de que Lucia estuvo presente.
Las otras muertes repentinas acaecidas cuando la enfermera no estaba allí quedaron así, por definición, excluidas de los cálculos de los investigadores. No eran sospechosas, porque Lucia no se encontraba presente. Pero la cosa empeora aún más. Nos pidieron que elaboráramos una lista de incidentes acaecidos durante los turnos de Lucia o al poco de terminados éstos, dijo un empleado del hospital. Eso sirvió para que los investigadores desenterraran más pautas y para que aumentara la probabilidad de que hallaran más muertes sospechosas durante los turnos de la enfermera. Mientras tanto, Lucia aguardaba su juicio en prisión.
Así se fabrican las pesadillas.
Al mismo tiempo, se ignoró casi por completo una enorme cantidad de información estadística. En los tres años anteriores a que Lucia entrara a trabajar en aquel pabellón, hubo siete muertes. En los tres años en los que sí trabajó en el pabellón, se contaron seis defunciones. Da que pensar: parece extraño que la tasa de mortalidad descendiera en un ala del hospital desde el momento preciso en el que una asesina en serie —dispuesta a matar a todo enfermo que se le pusiera por delante— llega a ella. Si Lucia los hubiera matado a todos, por tanto, durante los tres años que trabajó allí, no se habría producido ninguna muerte natural en aquel pabellón.
Ah, claro, pero, por otra parte, y como bien se encargó de revelar la fiscalía durante el juicio, a Lucia le gustaba el tarot. Y escribía cosas raras en su diario privado, del cual se leyeron fragmentos en voz alta en la vista oral. Así que tal vez fuera una asesina, de todos modos. Sin embargo, lo más extraño de todo es que, al generar la cifra espuria de turno, que esta vez fue de una probabilidad entre 342 millones, el estadístico de la fiscalía cometió un error matemático rudimentario y simple. Combinó test estadísticos individuales multiplicando sus valores p (la manera matemática de caracterizar la casualidad o, lo que es lo mismo, la significación estadística).
Esta parte es para los incondicionales de la ciencia más dura y será seguramente suprimida o acortada por el editor, pero voy a escribirla de todos modos: no se puede multiplicar los valores p entre sí y ya está. Hay que entrelazarlos con alguna herramienta estadística ingeniosa, como, quizás, el método de Fisher para la combinación de valores p independientes. Si multiplicamos los valores p entre sí sin más, los incidentes más inocuos y probables pasan de pronto a parecer sumamente improbables.
Pongamos que uno de ustedes ha trabajado en veinte hospitales y que en cada uno de ellos se ha observado una pauta inocua de incidentes (digamos que con un valor p=0,5). Si tomamos esos valores p neutros, que nos definen unos resultados puramente casuales, y los multiplicamos entre sí, obtendremos un valor p final de 0,5 elevado a la vigésima potencia, lo que viene a ser p < 0,000001, que es un valor de una suma, extrema y elevadísima significación estadística. Basándonos en ese error matemático y siguiendo el razonamiento de quien lo ha calculado, si ustedes cambian con frecuencia de hospital en el que trabajan, se convierten automáticamente en sospechosos. ¿Que sí, que alguno de ustedes ha trabajado en veinte hospitales diferentes? Por el amor de Dios, en ese caso, ni se le ocurra contárselo a la policía neerlandesa.
En junio de 2008 el caso fue reabierto y se investigó más a fondo la muerte de aquellos niños. La conclusión es que fueron muertes naturales y que el comportamiento en otros casos de Lucia de Berk había, incluso, salvado vidas.
No obstante, la naturaleza humana es algo compleja. Si tuvierais que llevar a un bebé a un hospital y supierais que Lucia de Berk trabaja allí, ¿estaríais tranquilos?
Fuentes:
Ben Goldacre, Mala ciencia.
http://www.badscience.net/2010/04/lucia-de-berk-a-martyr-to-stupidity/
http://en.wikipedia.org/wiki/Lucia_de_Berk

No hay comentarios:

Publicar un comentario