Estadística/Cálculo de probabilidades/Aleatoriedad y probabilidad/Probabilidad de varios acontecimientos

De Wikilibros, la colección de libros de texto de contenido libre.
Saltar a: navegación, buscar

Independencia Estocástica[editar]

Un frecuente objeto de estudio en la estadística es si los diferentes sucesos son dependientes o independientes uno del otro, es decir si favorece a la realización de un suceso a través de otro. Se analizan ejemplos en la investigación de mercados, si influyen el estatus y la educación de un consumidor la compra de un determinado periódico.

Ejemplo para conceptuar la independencia estocástica[editar]

Archivo:Eltern.png
Gráfico 1: Los sucesos: estudiantes que viven con sus padres - estudiantes que viven en otros lugares

Un extenso estudio de mercado sobre hábitos dentales de los consumidores ha encontrado que el 50% de los estudiantes de un pequeño instituto viven con sus padres. Por otro lado, el 50% de los estudaitnes prefieren pasta dental con tiras rojas y el 50% de cualquier otro color.

Veamos el suceso aleatorio: una estudiante viene de un país y compra pasta dental. Se definen los sucesos:

E: La estudiante vive con sus padres.
R: La estudiante compra pasta dental con franjas rojas.

Pregunta: Tiene el lugar donde vive esa estudiante alguna influencia en el color que ella elija?

Probablemente no, los eventos E y R son estocásticamente independientes, es decir con respecto a la teoría de probabilidades son independientes.

Nos interesa ahora el lugar donde vive la estudiante. En el gráfico 1 esta dividido el conjunto solución del lugar donde vive.

Pregunta: Qué porcentaje de los estudiantes, que viven con sus padres, comprarían probablemente pasta dental con franjas rojas?

Aqui se distribuyen la independencia de los eventos en relación a su color preferido igualmente, viviendo el 50% de compradores de pasta roja con sus padres y el 50% en otros lugares. Es decir, 50% de 50% de los estudiantes viven con sus padres y prefieren pasta con franjas rojas. Es por lo tanto:

P(R \cap E) = 0{,}5 \cdot 0{,}5 = 0{,}25.

El gráfico 2 muestra, como se divide la independencia de variables de lugar y la preferencia de color con su probabilidad.

Es ahora ejemplificada el P(E) =40% y P(R) = 60%, se obtiene la independencia de la distribución como en el gráfico 3, donde tenemos que el 60% deben comprar pasta roja al igual que el 60% vive en otros lugares y no con sus padres.

Archivo:ElternZahnpasta.png
Gráfico 2: Los sucesos vivienda (Wohnot) y color de la pasta dental (Zahnpasta) entrelazados
Archivo:ElternZahnpasta4 6.png
Gráfico 3: Los sucesos: Estudiantes mujeres con sus padres (bei den Eltern) - que no viven con sus padres (woanders)

Ejemplo para conceptuar la dependencia estocástica[editar]

Anteriormente contemplamos el caso que dos eventos sean independientes. En general se debe de ahi sacar que los sucesos que generalmente se analizan son dependientes.

En la rama del estudio del marketing se emplea datos de oficinas de salud en una ciudad muestra, en la que se preocupan de la salud de los dientes de los escolares. Se conoce de ese estudio que el 50% de los niños tienen caries y que el 50% de ellos se limpia regularmente los dientes.

Tenemos el suceso aleatorio: Se cuenta a un niño aleatoriamente.

Definimos el evento

Z: El niño de escuela se asea regularmente los dientes.
K: El niño de escuela tiene caries.
Archivo:Karies.png
Gráfico 4: Distribucón de los que se limpian sus dientes (Zähneputzern) y los que tienen caries (Kariesfällen)

Ahora es

P(Z \cap K) > P(Z \cap \bar K)

o \quad P(Z \cap K) < P(Z \cap \bar K)?

Es también la probabilidad, de obtener a un niño que regularmente se cepille los dientes y tenga caries mas grande que la probabilidad de obtener un niño que regularmente se cepille los dientes y no tenga caries o es al contrario, o es tal vez la probabilidad igual?

Es probable

P(Z \cap K) < P(Z \cap \bar K),

pues el cepillarse los dientes y la caries se conoce que no es independiente entre ellos. También son los eventos estocásticos Z y K dependientes. Obtenemos una distribución de la probablidad total que se parece a la del gráfico 4. Particularmente grande es P(Z ∩ K) y P(Z ∩ K).

La probabilidad general no podría volverse correcta con nuestra información, ésta depende de la fuerza de la dependencia.

Los sucesos estocásticos dependientes se interesan frecuentemente en los comportamientos condicionales de un evento, p.e. para las probabilidades condicionales.

P(K|\bar Z),

que un niño escogido aleatoriamente tenga caries cuando se conoce que no se lava regularmente los dientes.

Probabilidades Condicionales[editar]

Ejemplo[editar]

Archivo:KariesBayA.png
Como van ligados las caries y la costumbre de lavarse los dientes?

Un año después se realiza en esa escuela de prueba con propósito de investigar a 200 niños una serie de análisis sobre salud dental. Ahora se lavan los dientes regularmente el 60% de los niños. De esos niños, 40 tienen caries. Para informes oficiales se tiene que 60 niños tienen caries.

Debemos construir un diagrama de Venn a escala. En cada casilla estan 5 niños. Entonces:

P(Z) = 0{,}6; \qquad P(\bar Z) = 0{,}4;
P(Z \cap K) = 0{,}2; \qquad P(Z \cap \bar K) = 0{,}4;
P(\bar Z \cap K) = 0{,}3; \qquad P(\bar Z \cap \bar K) = 0{,}1.

Nos interesa ahora las probabilidades condicionales, que un niño tenga caries cuando se conoce que se lava los dientes:

P(K|Z).

Dicho en otras palabras: La cantidad de niños con caries de los niños que se cepillan los dientes regularmente.

Para la probabilidad condicional tenemos que

P(K|Z) = \frac{P(K \cap Z)}{P(Z)}.

Como se entiende esta probabilidad?

Se traen por lo pronto a todos los niños que se lavan regularmente los dientes al aula. De los 120 niños ahora se ha escogido aleatoriamente uno. Que probabilidad tiene ese niño caries? Observamos que de 120 niños 40 tienen caries.

Exactamente esa estrategia es el principio de la probabilidad condicional!

Resulta: P(K|Z) = \frac{40}{120} = \frac {1}{3}.

Un tercio de los niños que se limpian los dientes tienen caries, entonces naturalmente dos tercios no tienen caries. Vemos igualmente que el cálculo antes mencionado se representa por la conocida fórmula:

[[Imagen:KariesBayB.png|300px|thumb| Como se divide los casos de caries con relación a la costumbre de cepillarse los dientes?}}

P(K|Z) = \frac{P(K \cap Z)}{P(Z)} = \frac {40}{200}{ \frac{200}{120}} =  \frac{40}{120} = \frac{1}{3},

correspondientemente tenemos que:

P(\bar K|Z)= \frac{P(\bar K \cap Z)}{P(Z)}= \frac{ \frac{80}{200}}{ \frac{120}{200}}= \frac{2}{3},
P(K|\bar Z)= \frac{P(K \cap \bar Z)}{P(\bar Z)}= \frac{\frac{60}{200}}{ \frac{80}{200}}= \frac{3}{4},
P(\bar K|\bar Z)= \frac{P(\bar K \cap \bar Z)}{P(\bar Z)}= \frac{ \frac{20}{200}}{ \frac{80}{200}}= \frac{1}{4}.

Comparece este diagrama de Venn con el anterior! por qué se diferencian los dos diagramas?

Ejercicio[editar]

Es conocido que el curso de las acciones de la empresa Dachs en un 55% aumenta todos los dias de bolsa.

Evento: K1: el curso aumenta al primer día, K2: el curso aumenta al segundo día.

Se hace constar que las siguientes reglas para el desarrollo del curso de las acciones: el 40% de todos los observadores estiman que se incrementarán los dos primeros dias, el 15% que incrementará el primero pero disminuirá el segundo. En contra está 15% que cree que caerá el primero pero el segundo aumentará y el resto opina que caerá los dos días.

  1. Represente la probabilidad total en un diagrama de Venn
  2. Son los eventos K1 y K2 independientemente estocásticos? (Base una respuesta formal con ayuda d ela teoría de probabilidades).
  3. El día de hoy el curso aumenta:
    • Con que probabilidad aumentará mañana (busque: P(K2|K1))?
    • Qué probabilidad hay que caigán las acciones?
  4. Qué probabilidad hay que mañana las acciones aumenten, cuando hoy cayeron?

Teorema de Bayes[editar]

Frecuentemente se muestra la información sobre dos eventos como probabilidad condicional. Como se lo puede emplear?

Ejemplo para dos eventos[editar]

En un conocido parque temático se consumen diariamente grandes cantidades de bombillas para la decoración de los puestos. Para que el costo de los consumos no se aumente, el parque consume solo 60% de bombillas de marca y un 40% de bombillas sin marca. Debido a los observadores anteriores se conoce que de las bombillas de marca vienen el 5% mensual defectuosos. Empero las bombillas sin marca vienen mensualemente el 10% defectuosas.

Podemos representarlo gráficamente como en el gráfico 5: Cuando son defectuosos el 5% de las bombillas de marca, el 95% se queda bien. Entonces el 5% es la cantidad de bombillas defectuosas en las de marca, es decir se trata de una probabiliad condicional P(D|M).

Archivo:Bombilla.png
Gráfico 5. (Davon defekt = con defectos, davon ok = en buen estado)

El empresario del parque temático necesita la información para los planes de costos del próximo verano, cúan grande es la cantidad de bombillas de marca con defecto, es decir el busca P(M|D). Eso significa: Todas las bombillas defectuosas que se recojan en un día. Se saca un bombillo al azar'. Con que probabilidad se mantienen los bombillos de marca?

Entonces conocemos que:

P(M|D) = \frac {P(M \cap D)}{P(D)}

Lamentablemente no se conoce los componentes de la fracción. Encontramos solo un método para calcularlo.

Seguimos en la búsqueda del número P(M ∩ D): Conocemos P(D|M) y entonces cálculamos

P(D|M) = \frac{P(M \cap D)}{P(M)}

También se mantiene el conocido número en P(D|M) y puede calcularse fácilmente a través de la solución de una ecuación como

P(M \cap D) = P(D|M)P(M)

también

P(M \cap D) = 0{,}05 \cdot 0{,}6 = 0{,}03.

Ahora falta aún el denominador P(D). Contemplemos el diagrama de Venn del gráfico 6. D une a la intersección entre D ∩ M y ∩ \;_{\bar M}.

La probabilidad total de D es entonces la suma de

P(D) = P(M \cap D) + P(\bar M \cap D).

se entiende que se demuestra como teorema la probabilidad total y eso nos da como hemos visto antes

P(D) = P(D|M)P(M) + P(D| \bar M)P(\bar M),

en nuestro ejemplo

P(D) = 0{,}05 \cdot 0{,}6 + 0{,}1 \cdot 0{,}4 = 0{,}07.

Son entonces el 7% de todas las bombillas defectuosas.

La buscada probabilidad condicional es ahora

P(M|D) = \frac{P(M \cap D)}{P(D)} = \frac{P(D|M)P(M)}{P(D|M)P(M) + P(D| \bar M)P(\bar M)},

Esta formúla es conocida como el Teorema de Bayes.

La probabilidad que necesitabamos es

P(M|D) = \frac{0{,}03}{0{,}07} = 0{,}4286.

Esta probabilidad resulta por eso sorpresivamente alta porque se usan 50% más bombillas de marca que sin marca. Correspondientemente es el número de las bombillas sin marca con defecto es de 0,5714.

Ahora queremos analizar que ocurre con mas de dos eventos.

Ejemplo para mas de dos eventos[editar]

Una expedición ocupada por tres conductores de camión, los señores Ahorn, Behorn y Zehorn. Ahorn conduce el 50% de todo el camino, Behorn el 20% y Zehorn el 30%. De la experiencia se conoce que Ahorn produce una abolladura del 10% de todo el viaje, Behorn el 15% y Zehorn el 20%. (véase el gráfico 7)

Definimos el evento:

F1: Ahorn conduce, F2:Behorn ..., F3:Zehorn ...
B: se ha producido una abolladura.

Queremos primero mantener los casos: cuando Ahorn conduce produce el 10% de abolladuras de todo el viaje, desarrolla el el resto 90% sin problemas.

Archivo:Lastwagen.png
Gráfico 7 (aller Fahrten = todos los viajes, dabei Beule = con abolladuras, keine beule = sin abolladuras)

Nos interesa la probabilidad que Ahorn haya conducido cuando aparece una abolladura en un camión una proxima vez, es decir para P(F1|B).

Es otra vez

P(F_1|B) = \frac {P(F_1 \cap B)}{P(B)}.

Del teorema de multiplicación de la probabilidad debe ser

P(F_1 \cap B) = P(B|F_1){P(F_1)}

y también

P(F_1 \cap B) = 0{,}1 \cdot 0{,}5 = 0{,}05.

Pero como se obtiene P(B)? También aqui vale nuevamente el teorema de la probabilidad total, p.e.:

P(F_1 \cap B) = P(B|F_1) \cdot P(F_1) .

Obtenemos entonces para P(B)

P(B) = P(F_1 \cap B) + P(F_2 \cap B) + P(F_3 \cap B)
= P(B|F_1)P(F_1) + P(B|F_2)P(F_2) + P(B|F_3)P(F_3),

también

P(B) = 0{,}1 \cdot 0{,}5 + 0{,}15 \cdot 0{,}2 \cdot 0{,}3 = 0{,}05 + 0{,}03 + 0{,}06 = 0{,}14

Nuestra buscada probabilidad sería

P(F_1|B) = \frac{P(F_1 \cap B)}{P(B)} = \frac {0{,}05}{0{,}14} = 0{,}3571

que es correspondiente a

P(F_2|B) = \frac{0{,}03}{0{,}14} = 0{,}2143

y

P(F_3|B) = \frac {0{,}06}{0{,}14} = 0{,}4286

Entonces Zehorn ha conducido con gran probabilidad de tener abolladuras.

Teorema de la multiplicacion[editar]

De la fórmula de la probabilidad condicionada

P(B \mid A) = \frac{P(A \cap B)}{P(A)}

Se deduce

P(A \cap B)=P(A) \cdot P(B \mid A)
P(A \cap B)=P(B) \cdot P(A \mid B)

Ejemplo[editar]

P(Encontrar alumno en Escuela Politecnica) = 0.12
P(Chica Escuela Politecnica) = 0.05 = P(Chica|Escuela Politecnica)
¿Cual es la probabilidad de encontrar una alumna en la universidad y que sea de la Escuela Politecnica?
P(Chica \cap Escuela Politecnica) = P(Escuela Politecnica) \cdot P(Chica \cap Escuela Politecnica) = 0.12 \cdot 0.05 = 0.006


Conocimiento teórico[editar]

  • Dos eventos A y B de Ω:
Son independientemente estocásticos, cuando su probabilidad total es igual al producto de sus probabilidades individuales:
P(A \cap B) = P(A) \cdot P(B).
Se cumple que los eventos no se los considera fundamentalmente independientes.
La probabilidad condicional para A y B es
P(A|B) = \frac{P(A \cap B)}{P(B)} y P(B|A) = \frac{P(A \cap B)}{P(A)}.
El teorema general de multiplicación de probabilidades:
P(A \cap B) = P(A|B)P(B) = P(B|A)P(A).
Teorema de Bayes:
P(A|B) = \frac{P(A \cap B)}{P(A)} = \frac{P(A|B)P(B)}{P(A|B)P(B) + P(A| \bar B)P(\bar B)}.
  • Generalización para m eventos Ai (i=1,...,m):
Estos m eventos se descomponen de conjuntos solución, es decir éstos son disjuntos y llenados en Ω. B es entonces
P(B) = P(A_1 \cap B) + P(A_2 \cap B) + \dots + P(A_m \cap B).
Vale aquí el teorema de Bayes:
P(A_i|B) = \frac{P(A_i \cap B)}{P(B)} = \frac{P(B|A_i)P(A_i)}{\sum_{j=1}^{m} P(B|A_j)P(A_j)}


    • Ejercicios:
Qué es P(A|B) cuando A y B son disjuntos?
Qué es P(A|B) cuando A y B son independientemente estocásticos?

Soluciones de los Ejercicios[editar]


↓ Sucesos Combinatorios Aleatorios
↑ Cálculo de Probabilidades
↑↑ Sucesos Aleatorios y Probabilidad