Inteligencia Artificial II

Teorema de Bayes

En la teoría de la probabilidad el teorema de Bayes es un resultado enunciado por Thomas Bayes en 1763 que expresa la probabilidad condicional de un evento aleatorio A dado B en términos de la distribución de probabilidad condicional del evento B dado A y la distribución de probabilidad marginal de sólo A.

Sea {A1,A3,...,Ai,...,An} un conjunto de sucesos mutuamente excluyentes y exhaustivos, y tales que la probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se conocen las probabilidades condicionales P(B | Ai). Entonces, la probabilidad P(Ai | B) viene dada por la expresión:

dónde:
  • P(Ai) son las probabilidades a priori. 
  • P(B | Ai) es la probabilidad de B en la hipótesis Ai. 
  • P(Ai | B) son las probabilidades a posteriori.
Además, unido a la definición de Probabilidad condicionada, obtenemos la Fórmula de Bayes, también conocida como la Regla de Bayes:

 

Aplicaciones:

El teorema de Bayes es válido en todas las aplicaciones de la teoría de la probabilidad. Sin embargo, hay una controversia sobre el tipo de probabilidades que emplea. En esencia, los seguidores de la estadística tradicional sólo admiten probabilidades basadas en experimentos repetibles y que tengan una confirmación empírica mientras que los llamados estadísticos bayesianos permiten probabilidades subjetivas. El teorema puede servir entonces para indicar cómo debemos modificar nuestras probabilidades subjetivas cuando recibimos información adicional de un experimento. La estadística bayesiana está demostrando su utilidad en ciertas estimaciones basadas en el conocimiento subjetivo a priori y el hecho de permitir revisar esas estimaciones en función de la evidencia empírica es lo que está abriendo nuevas formas de hacer conocimiento. Una aplicación de esto son los clasificadores bayesianos que son frecuentemente usados en implementaciones de filtros de correo basura o spam, que se adaptan con el uso.

Como observación, se tiene y su demostración resulta trivial.

Ejemplo: 

Una fábrica produce un artículo en tres diferentes maquinas. Del total de la producción el 30% es producido en la maquina A, el 50% en la B y el 20% lo produce la maquina C. la probabilidad de que un artículo producido por una maquina especifica se de primera calidad, se muestra la siguiente tabla.

Maquina
Probabilidad
A
0.8
B
0.7
C
0.9


Si se selecciona un artículo aleatoriamente de la línea de producción:

     a)¿Cuál es la probabilidad de que sea de primera calidad?

     b)¿Si el articulo seleccionado es de primera calidad, cual es la probabilidad de que haya sido producido por la maquina A?



Una fábrica produce un artículo en tres diferentes maquinas. De total de la producción el 30% es producido en la maquina A, el 50% en la B y el 20% lo produce la maquina C.

 
La probabilidad de que un artículo producido por una maquina específica sea de primera calidad, se muestra en la siguiente tabla:

Maquina
Probabilidad
A
0.8
B
0.7
C
0.9




                 

Si se selecciona un articulo aleatoriamente de la linea de produccion: 

    a) ¿Cuál es la probabilidad de que sea de primera calidad?

 


Lo que significa que: la probabilidad de obtener un articulo de primera calidad es del 77% Si se selecciona un articulo aleatoriamente de la linea de produccion:   

b) ¿Si el articulo seleccioado es de primera calidad, cual es la probabilidad de que haya sido producido por la maquina A?


 

Por lo tanto podemos concluir que la probabilidad de que la maquina A haya producido un articulo de primera calidad elegido al azar es del 31%

========================================================
Red Bayesiana

Para el desarrollo de nuestro laboratorio, hemos considerado las siguientes variables aleatorias:
  • D: práctica deportiva habitual
  • A: alimentación equilibrada
  • S: presión sanguínea alta
  • F: fumador
  • I: ha sufrido un infarto de miocardio

Las relaciones causales y el conocimiento probabilístico asociado están reflejadas en la siguiente red bayesiana: 
 
Podemos usar la red bayesiana para calcular la probabilidad de fumador si se ha sufrido un infarto y no se hace deporte, P(F|i, ¬d), para ello:
  • Seguiremos el siguiente orden de variables, inspirado en la topología de la red (de abajo a arriba): I, F, S,A,D.
  • Aunque igual otro orden sería más eficiente, pero eso no lo sabemos a priori
  • Entonces finalmente luego de los cálculos nos queda
  • P(F|i, ¬d) = <0,48,>