Una fiabilidad del 99% ¿puede no ser tan fiable?
Con esta entrada Hablando de Ciencia participa en la edición 2.8 del Carnaval de Matemáticas celebrado en Ciencia Conjunta.
Aleatorio y Varianza se conocieron en la consulta del doctor Don Máximo Común el día en el que, casualmente, ambos iban a verlo por culpa de un persistente dolor de estómago. Después de hacerles un reconocimiento, el doctor les dijo que podían padecer una rara enfermedad que sólo afectaba a 1 de cada 100 pacientes que presentaban sus mismos síntomas, y para descartarla debía hacerles una prueba específica que tenía una fiabilidad del 99%, es decir, que sólo fallaba en el diagnóstico de 1 paciente de cada 100.
Al cabo de unos días ambos volvieron para conocer los resultados de la prueba. Cuando se encontraron, Aleatorio dijo:
– La prueba ha dado negativa, pero como aún existe una probabilidad del 1% de que el test haya fallado le he pedido al doctor que la repita.
Tras escucharlo, Varianza le contestó:
– A mí la prueba me ha dado positiva, pero como todavía hay una probabilidad del 50% de que yo en realidad no tenga la enfermedad pediré una segunda opinión.
¿Han acertado Aleatorio y Varianza en sus cálculos o a alguno de ellos le traiciona su intuición? Piénselo un poco antes de continuar.
Comencemos por Aleatorio. Él sabe que la fiabilidad del test es del 99%, luego piensa que la probabilidad de que haya fallado, y por tanto de tener la enfermedad, es del 1% y eso no le deja tranquilo. Sin embargo Aleatorio está equivocado, pues en realidad está confundiendo la probabilidad de obtener un resultado negativo teniendo la enfermedad con la de aún habiendo obtenido un resultado negativo, tener la enfermedad.
Me explico: la primera situación se puede resumir como que ocurra «el test da negativo» bajo la condición «tener la enfermedad», y esta probabilidad viene dada por la fiabilidad del test y es del 1%. Pero Aleatorio no sabe a ciencia cierta si tiene la enfermedad o no, luego no puede imponer esa condición. Lo que sí puede plantearse Aleatorio es la posibilidad de que ocurra «tener la enfermedad» bajo la condición «el test da negativo», pues sabe que esto último sí ha ocurrido. Esto, que es la segunda situación descrita, es el suceso cuya probabilidad debe conocer Aleatorio para decidir si necesita una segunda opinión o no.
Lo que hay que calcular por tanto es la probabilidad de que ocurra «tener la enfermedad» condicionada por «el test da negativo». Atendiendo a la definición de probabilidad condicionada, esto se hace dividiendo la probabilidad de que Aleatorio tenga la enfermedad y el test dé negativo entre la probabilidad de que el test dé negativo tenga o no tenga Aleatorio la enfermedad. Vamos a hacerlo fijándonos en este gráfico en el que se detalla la situación:
Aquí vemos que para que ocurran «tener la enfermedad» y «el test da negativo», ambos a la vez, tenemos que ir desde «dolor de estómago» hasta «test negativo» pasando por «tener la enfermedad». La probabilidad de hacer ese camino se calcula multiplicando las probabilidades de tomar cada rama del mismo, esto es, 0,01×0,01 = 0,0001.
Por otro lado, como hay dos maneras diferentes de llegar a «el test da negativo», la probabilidad de que ocurra «el test da negativo» será la suma de la probabilidad de llegar a «test negativo» pasando por «tener la enfermedad» más la probabilidad de hacerlo pasando por «no tener la enfermedad». La primera ya la hemos calculado, y la segunda es 0,99×0,99 = 0,9801; por tanto, la probabilidad de que el test dé negativo tengamos o no la enfermedad, es de 0,0001+0,9801=0,9802.
Así, la probabilidad de que Aleatorio tenga la enfermedad aunque el test haya dicho que no la tiene es de 0,0001/0,9801 = 0,000102, y esto es una probabilidad de aproximadamente el 0,01%, cien veces más pequeña que el 1% que él defendía al principio. Aleatorio puede entonces quedarse bastante tranquilo con el resultado, pues no parece razonable preocuparse por una probabilidad así en esta situación.
Veamos ahora si Varianza tiene razón o no. Ella afirma que, habiendo dado el test un resultado positivo, aún tiene una probabilidad del 50% de no tener la enfermedad. Razonando de la misma manera que antes, lo que tenemos que calcular es la probabilidad de «no tener la enfermedad» condicionada por «el test ha dado positivo», esto es, la probabilidad de que ocurran «no tener la enfermedad» y «el test ha dado positivo» (las dos a la vez) dividida por la probabilidad de que ocurra «el test ha dado positivo» tanto si se tiene la enfermedad como si no.
Si hacemos las cuentas, tenemos que la probabilidad buscada es (0,99×0,01) / (0,99×0,01+0,01×0,99) = 0,5. Es decir, sorprendentemente Varianza sí que tiene razón: aunque la fiabilidad del test es del 99%, al obtener un resultado positivo aún existe una probabilidad bastante grande de no tener la enfermedad, por lo que haría bien en realizar otras pruebas que confirmasen el diagnóstico.
¿Significa esto que el test no es fiable, como sugiere el título? Ni mucho menos. Si el paciente tiene la enfermedad, el test indica que así es en el 99% de las ocasiones, mientras que si no la tiene también lo indica en la misma proporción, y eso significa que es realmente fiable.
Lo que ocurre es que la probabilidad de que la persona a la que se le hace el test no tenga la enfermedad es tan grande que amplifica la probabilidad de obtener un falso positivo hasta hacerla del 50% (se puede intuir cómo funciona esto haciendo pruebas: si realizamos los mismos cálculos con una enfermedad que no afecte al 98% de los pacientes vemos que la probabilidad de obtener un falso positivo es ya del 33%, y para otra que no afecte al 95% se reduce a sólo el 16%).
Así que si alguna vez se ven en una situación como esta, quédense tranquilos con los resultados negativos y no pierdan del todo la esperanza con los positivos, pues aunque las pruebas sean muy fiables es razonable pedir una segunda opinión. Como dice el refrán (o como debería decir), la estadística es lo último que se pierde.
Javier Oribe
Cada imagen está enlazada con su fuente
Jose David
Publicado el 10:40h, 21 noviembreGenial, no hay otra palabra para definir el articulo. Genial. Si mis profesores de Probabilidad me explicaran asi las cosas, hace tiempo hubiera terminado la carrera.
Calculare de nuevo la probabilidad de aprobar el examen SABIENDO que soy muy malo y he perdido por completo «estadistica».
Saludos.
javieroribe
Publicado el 10:49h, 21 noviembreGracias José David, y ánimo con los exámenes!
Ricardo
Publicado el 19:45h, 21 noviembreMuy bueno. Hace tiempo tuve una experiencia equivalente con mi veterinario (el de mis perros, claro) sobre la sensitividad de la prueba del moquillo (distemper) y escribí una nota al respecto: Falsos negativos.
Javier Oribe
Publicado el 21:25h, 21 noviembreAcabo de leer tu entrada, muy buena por cierto, y explicamos los dos lo mismo, salvo que tú lo haces de una manera bastante más técnica.
He intentado simplificar la explicación todo lo posible y por eso he evitado mencionar explícitamente el Teorema de Bayes, aunque en realidad es el resultado que estoy utilizando (y el que sale en la fotografía de las luces de neón).
Por cierto, la primera vez que ví este problema fue en un libro de John Paulos, aunque no soy capaz de recordar exactamente cual, ¿alguien lo sabe?
Un saludo.
Ricardo
Publicado el 21:35h, 21 noviembreNo he tenido oportunidad de leer los libros de Paulos, pero podría ser el de Un matemático lee el periódico.
Ya mandé mi entrada al Carnaval.¡Saludos!
Javier Oribe
Publicado el 22:04h, 21 noviembreYo creo que es ese, pero no estoy seguro.
Ah, y ya ví lo del Carnaval, me despisté 😀
Pingback:Una fiabilidad del 99% ¿puede no ser tan fiable?
Publicado el 20:30h, 21 noviembre[…] "CRITEO-300×250", 300, 250); 1 meneos Una fiabilidad del 99% ¿puede no ser tan fiable? http://www.hablandodeciencia.com/articulos/2011/11/21/una-fiabil… por equisdx hace […]
Pingback:Una fiabilidad del 99% ¿puede no ser tan fiable?
Publicado el 20:51h, 21 noviembre[…] los comentarios 1 visto 1 alma 20 Una fiabilidad del 99% ¿puede no ser tan fiable? […]
Pingback:Anónimo
Publicado el 22:01h, 21 noviembre[…] […]