Estadística en Microcomputadores/Generación de Valores aleatorios

3.4 GENERACION DE VALORES ALEATORIOS DE UNA DISTRIBUCION

Este proceso involucra la obtención "simulada" de valores de una variable que responde a una distribución de probabilidad establecida. La condicón fundamental a respetar en ello es que la secuencia de valores de la variable se obtenga de manera aleatoria, es decir, reproduciendo el proceso probabilístico establecido por la distribución.

La utilidad principal de la generación de valores aleatorios es en estudios de simulación, en los cuales se reproduce en un computador un determinado proceso, dentro del cual puede definirse mediante modelos de distribuciones de probabilidad el comportamiento de algunas de sus variables.

Otra aplicación interesante del proceso de generación es para la obtención "simulada" de muestras de distribuciones teóricas con las cuales se puedan verificar numericamente hipótesis o condiciones de un cierto proceso estadístico. La propiedad básica que se aplica en la generación de valores de variables aleatorias es que ellos se pueden obtener, para cualquier distribución de probabilidad, en función de valores de una particular, la uniforme en el intervalo 0-1. Esta distribución presenta una densidad de probabilidad constante en dicho intervalo, con lo cual todos los valores dentro de él tienen igual probabilidad de ocurrencia:

La generación de valores aleatorios uniformes normalizados es sencilla en un computador, mediante funciones o rutinas específicas para ello. Sobre esta base el proceso de generación de valores de cualquier distribución se resuelve en la medida que, dada la función de probabilidad acumulada F(x), podemos encontrar la función inversa F-1( ). Un valor aleatorio x resulta, aplicando dicha función inversa:

x = F-1(r)

siendo r un valor aleatorio uniforme normalizado. En la figura anterior se muestra, en términos gráficos, el concepto de cálculo de dicha función. Por ejemplo, para la distribución exponencial, cuya función F(x) vale:

F(x) = 1 - exp( - /x ) = r

resulta:

x = - ln( 1 - r )

Existen algunas distribuciones de probabilidad para las que no es posible obtener la función inversa F-1( ). Un método alternativo en esos casos es el denominado de Aceptación- Rechazo. Este método se basa, en su concepción más simple, en la generación de dos valores aleatorios, uno x uniforme en el intervalo a,b de validez de la distibución considerada, y el otro y, uniforme entre 0 y un valor c igual o mayor que el máximo de la función f(x) para la distribución considerada. Si se cumple que y es igual o menor que el valor de f(x) para x, es decir:

y f(x)

el valor de x es un valor aleatorio de la distribución considerada:

El método se puede generalizar a fin de disminuir en la mayor medida posible el porcentaje de valores x desechados. En otros casos se debe recurrir a transformaciones de la variable considerada a otras, para las cuales sí es posible obtener valores aleatorios. Para alguna distribución específica, entre las que se encuentran la mayor parte de las distribuciones discretas, se usa alguna propiedad específica de la distribución, como por ejemplo la reproducción de los procesos aleatorios mediante los cuales se define la distribución.