Teorema de Bayes

Introducción

Como uno de los resultados más útiles de la teoría de probabilidad, el teorema de Bayes permite actualizar el conocimiento o recalcular la probabilidad de un evento de interés cuando encontramos nueva evidencia de su ocurrencia.

Pregunta

❤ La prueba médica (la evidencia) resultó negativa, ¿cuál es la probabilidad de que realmente no tenga la enfermedad?

Sean $A$ y $B$ eventos en los que se asume inicialmente una dependencia de $B$ a la ocurrencia de $A$ tal que, si $P (A) \neq 0$ ,

P (B ∣ A) = \frac{P (B \cap A)}{P (A)}

También existe una relación inversa en que, si $P (B) \neq 0$ , se cumple que

P (A ∣ B) = \frac{P (A \cap B)}{P (B)}

Del álgebra de conjuntos se sabe que $P (B \cap A) = P (A \cap B)$ , y es posible igualar estas dos ecuaciones,resultando:

"Regla de la probabilidad condicional inversa"

P (A ∣ B) = \frac{P (B ∣ A) P (A)}{P (B)}

Una ecuación equivalente se obtiene de una sustitución de $P (B)$ en términos de una probabilidad total:

Ejemplo

P (A_{n} ∣ B) = \frac{P (B ∣ A_{n}) P (A_{n})}{P (B ∣ A_{1}) P (A_{1}) + \dots + P (B ∣ A_{N}) P (A_{N})}

donde $A_{n}$ es una partición universal para $n = 1, 2, \dots, N$ .

Una intuición importante de esta ecuación es que la ocurrencia de $B$ puede deberse a múltiples factores (en este caso, cualquiera entre $A_{1}, \dots, A_{N}$ ), pero estamos interesados en la relación con uno de ellos en particular, $A_{n}$ .
Esta relación puede, o no, ser de causalidad.

Definiciones:

Ejemplo

P (A_{n} ∣ B) = \frac{P (B ∣ A_{n}) P (A_{n})}{P (B ∣ A_{1}) P (A_{1}) + \dots + P (B ∣ A_{N}) P (A_{N})}

$P (A_{n})$ : probabilidades a priori, dado que se conocen para cada evento $A_{n}$ antes de la ejecución del experimento.
$P (B ∣ A_{n})$ : son probabilidades condicionales directas o probabilidades de transición en teoría de telecomunicaciones. Típicamente son conocidas antes de ejecutar el experimento.
$P (A_{n} ∣ B)$ : probabilidades a posteriori o condicionales inversas, dado que se investigan después de la ejecución del experimento, cuando se obtiene un evento $B$ .

Ejemplo de incidencia de una enfermedad poco común

Se ha desarrollado un examen de diagnóstico para una enfermedad extraña que afecta solo a 1 de cada 1000 adultos. En análisis estadísticos médicos de clasificación binaria (sí o no) se define:

Definiciones:

Sensitividad: Un resultado positivo implica que el individuo efectivamente tiene la enfermedad en el 99 % de los casos (también llamada probabilidad de detección). Un resultado contrario es un falso negativo.
Especificidad: Un individuo sin la enfermedad dará resultado negativo 98 % de las veces (también llamada tasa negativa verdadera). Un resultado contrario es un falso positivo.

¿Cuál es la probabilidad de que el paciente sí tenga la enfermedad si el diagnóstico es positivo?

Cálculo con el Teorema de Bayes:

Árbol de probabilidad de Bayes

\begin{aligned} P (B ∣ A) & = \frac{P (A ∣ B) P (B)}{P (A ∣ B) P (B) + P (A ∣ \overset{―}{B}) P (\overset{―}{B})} \\ = \frac{(0.99) (0.001)}{(0.99) (0.001) + (0.02) (0.999)} \\ = 0.0472 \approx 5 % \end{aligned}

La probabilidad de que el paciente sí tenga la enfermedad es del 5 %… a pesar de que el resultado del examen fue positivo.

"¿Por qué es tan baja esta probabilidad, con una sensibilidad de la prueba del 99 %?"

Otros valores comunes

Cuadro: Otros valores de sensitividad y especificidad para algunos exámenes de enfermedades comunes

Enfermedad	Sensitividad	Especificidad
Cáncer de próstata	85 %	30 %
Cáncer de mama	75 %	92 %
Cáncer de colon	86 %	93 %
COVID-19 BioMedomics	89 %	91 %

Ejemplo del apagón en el sistema eléctrico

Un barrio de Heredia experimenta un apagón. Una ingeniera de operación y mantenimiento de ESPH está cerca de ahí e inmediatamente sospecha de cuatro orígenes de la falla: ( $A_{1}$ ) en la línea de transmisión Colima - Heredia, ( $A_{2}$ ) en el transformador de la subestación de Heredia, ( $A_{3}$ ) en la línea de distribución hacia San Pablo o en ( $A_{4}$ ) el transformador del poste.

Sabe la ingeniera que ante una falla en el transformador de subestación siempre habrá una desconexión permanente. ¿Cuál es la probabilidad de que la causa de la desconexión permanente haya sido una falla en ( $A_{2}$ ) el trafo de subestación?

Las protecciones del sistema eléctrico ejecutan dos operaciones ante una falla: o ( $B$ ) una desconexión permanente o ( $\overset{―}{B}$ ) un "recierre" luego de un tiempo prudencial si la falla ha desaparecido.

Los datos conocidos para el último mes son los siguientes:

Falla	Casos	Recierre	Desconexión
$A_{1}$ Línea de transmisión	3	2	1
$A_{2}$ Trafo de subestación	3	0	3
$A_{3}$ Línea de distribución	16	9	7
$A_{4}$ Trafo de poste	8	0	8

Para encontrar la probabilidad de cada falla, analizamos su frecuencia relativa con los datos provistos (se descartan aquí otros tipos de fallas). Por tanto

$P (A_{1}) = 3 / 30 = 0.10$
$P (A_{2}) = 3 / 30 = 0.10$
$P (A_{3}) = 16 / 30 = 0.5333$
$P (A_{4}) = 8 / 30 = 0.2666$

Sean $B = {desconexión permanente}$ y $\overset{―}{B} = {recierre}$ . La probabilidad que buscamos es una proporción entre el evento de interés y todas las posibilidades juntas:

Probabilidad de que A_{2} sea la causa de B = \frac{Probabilidad de que sucedan A_{2} y B}{Suma de las probabilidades de todas las combinaciones A_{n} y B}

y que puede expresarse como:

P (A_{2} ∣ B) = \frac{P (A_{2} \cap B)}{P (⋃_{n = 1}^{4} A_{n} \cap B)} = \frac{P (A_{2}) P (B ∣ A_{2})}{P (B)}

que es otra forma de escribir la regla de Bayes. La gráfica a continuación muestra los "caminos" posibles y el evento de interés está resaltado.

Árbol

Con $P (B ∣ A_{1}) = \frac{1}{3} = 0.3333$ , $P (B ∣ A_{2}) = 1$ , $P (B ∣ A_{3}) = \frac{7}{16} = 0.4375$ , $P (B ∣ A_{4}) = 1$ :

INFO

\begin{aligned} P (A_{2} ∣ B) & = \frac{P (A_{2}) P (B ∣ A_{2})}{P (A_{1}) P (B ∣ A_{1}) + P (A_{2}) P (B ∣ A_{2}) + P (A_{3}) P (B ∣ A_{3}) + P (A_{4}) P (B ∣ A_{4})} \\ = \frac{(0.1) (1)}{(0.1) (0.3333) + (0.1) (1) + (0.5333) (0.4375) + (0.2666) (1)} \\ = 0.1579 \end{aligned}

que representa una probabilidad quizá más baja de lo esperado. A pesar de que una falla en el transformador de subestación siempre provoca una desconexión permanente (y el consiguiente apagón), no son fallas comunes, y por eso su probabilidad sigue siendo baja. En este problema las probabilidades más alta son las de fallas de líneas de distribución $P (B ∣ A_{3}) = 0.3684$ (expuestas a ramas, choques, etc.) y los trafos de poste $P (B ∣ A_{4}) = 0.4210$ , que son menos casos pero siempre implican desconexión.

Ejemplo de los distribuidores de jocotes

Tres distribuidores de frutas, $A$ , $B$ y $C$ , entregan jocotes a un supermercado. Un día la inspección de producto encuentra, con cierto alborozo, una "guápil" (dos jocotes que nacieron juntos) en un contenedor donde están todos los jocotes de todos los distribuidores, revueltos e indistinguibles entre sí. En este lote de producto, $A$ entregó (aproximadamente) 800 jocotes, $B$ 700 y $C$ 500. En estudios previos se ha determinado que la incidencia de guápiles en cada distribuidora es del 1% en $A$ , del 2% en $B$ y del 5% en $C$ .

"¿Cuál es la probabilidad de encontrar una guápil? Si una guápil es encontrada, ¿cuál es la probabilidad de que vino de $C$ ?"

Sean $P (A)$ , $P (B)$ y $P (C)$ las probabilidades de encontrar un jocote de los distribuidores $A$ , $B$ y $C$ , respectivamente. No son equiprobables, sino que están obtenidas por frecuencia relativa de la forma:

\begin{aligned} P (A) & = \frac{800}{800 + 700 + 500} = \frac{800}{2000} = 0, 4 \\ P (B) & = \frac{700}{2000} = 0, 35 \\ P (C) & = \frac{500}{2000} = 0, 25 \end{aligned}

La probabilidad de encontrar una guápil, $P (G)$ , es la probabilidad total dada por:

\begin{aligned} P (G) & = P (A) P (G ∣ A) + P (B) P (G ∣ B) + P (C) P (G ∣ C) \\ = 0.4 \cdot 0.01 + 0.35 \cdot 0.02 + 0.25 \cdot 0.05 \\ = 0.0235 = 2.35 % \end{aligned}

La probabilidad condicional inversa de que si una guápil fue encontrada esta vino del distribuidor $C$ , $P (C ∣ G)$ , viene dada por el teorema de Bayes como:

\begin{aligned} P (C ∣ G) & = \frac{P (C) \cdot P (G ∣ C)}{P (G)} \\ = \frac{P (C) \cdot P (G ∣ C)}{P (A) \cdot P (G ∣ A) + P (B) \cdot P (G ∣ B) + P (C) \cdot P (G ∣ C)} \\ = \frac{0.25 \cdot 0.05}{0.0235} = 0.5319 = 53.2 % \end{aligned}

Observar (resaltado) como la probabilidad de que la guápil vino de $C$ es una proporción con las probabilidades de que venga de los otros distribuidores.

Videos y referencias en internet

Probability Part 2: Updating Your Beliefs with Bayes
CrashCourse https://youtu.be/oZCskBpHWyk
Bayes theorem, and making probability intuitive
3Blue1Brown https://youtu.be/HZGCoVF3YvM
The quick proof of Bayes' theorem
3Blue1Brown https://youtu.be/U_85TaXbeIo

Teorema de Bayes ​

Definiciones: ​

Definiciones: ​

Cálculo con el Teorema de Bayes: ​

Otros valores comunes ​

Los datos conocidos para el último mes son los siguientes: ​

Videos y referencias en internet ​

Teorema de Bayes

Definiciones:

Definiciones:

Cálculo con el Teorema de Bayes:

Otros valores comunes

Los datos conocidos para el último mes son los siguientes:

Videos y referencias en internet