Estadística en Microcomputadores/Generación de Valores Aleatorios

De Wikilibros, la colección de libros de texto de contenido libre.

13.3 GENERACION DE VALORES ALEATORIOS

Mediante este proceso se obtienen valores aleatorios de una cierta distribución que se especifica. En los Cuadros 13.6 y 13.7 se incluyen las expresiones y procedimientos que se utilizan para generar valores aleatorios de las distribuciones que considera el sistema.

La generación de valores aleatorios de una distribución determinada mediante el sistema ESTAD involucra la ejecución de los siguientes pasos:

a) Selección del tipo de generación a realizar, del siguiente menú:

OBTENCION DE

1 - Valores Aleatorios de una Distribucion

2 - Estadísticas Descriptivas de Muestras Aleatorias

Con la primera opción del menú se obtiene como resultado un conjunto o muestra de valores individuales de la distribución considerada. Con la segunda opción, en cambio, se pueden obtener valores de estadísticas descriptivas para cada una de un conjunto de muestras de valores aleatorios de una cierta distribución.

b) Selección del tipo de distribución a considerar, siguiendo el procedimiento descripto en el paso b) de la sección 13.1.

c) Ingreso de los parámetros de la distribución elegida, siguiendo el procedimiento descripto en el paso c) de la sección 13.1.

d) Ingreso de datos necesarios para el proceso. Si en el menú anterior se elige la opción 2 se ingresa el número de muestras a generar.

A continuación de ello y para ambas opciones se ingresa el número de valores aleatorios a generar en cada muestra. Por último se interroga si se desea definir una cierta secuencia de valores aleatorios uniformes estandarizados. En caso afirmativo se ingresa un número entero entre -32767 y 32767, mediante el cual puede reproducirse una generación efectuada previamente, ingresando el mismo valor.

En el caso de la distribución uniforme discreta se responde a la interrogación sobre si la generación es sin reposición.

e) Si en a) se seleccionó la generación de valores de una distribución se define, optativamente, la variable de la memoria de trabajo donde se desea almacenar los valores generados (dos variables en el caso de la distribución Normal Bidimensional), siguiendo el procedimiento descripto en .

f) Para el mismo caso, el computador realiza la generación y presenta en pantalla los valores obtenidos. Si en el paso e) se definió una (o dos) variable de la memoria de trabajo se almacenan en ella dichos valores.

g) Si se requiere la obtención de estadísticas descriptivas de varias muestras de valores aleatorios se seleccionan las estadísticas deseadas, mediante el siguiente menú:

ESTADISTICA A OBTENER

1 - Valor Medio

2 - Desvío Estándar

3 - Estadística t

4 - Estadística Chi2

5 - Estadística definida por el Usuario

Se pueden definir algunas o todas de las estadísticas consignadas, mediante su selección consecutiva en el menú anterior.

Los criterios de cálculo de las estadísticas son los siguientes:

- Valor Medio y Desvío Estándar: se consideran las expresiones de cálculo vistas en la sección .

- Estadísticas t y Chi2: se aplican las expresiones contempladas en las pruebas sobre el valor esperado y sobre el desvío estándar de una variable normal (sección 14.1).

- Estadística definida por el usuario: puede ser cualquier estadística calculable sobre una muestra de valores de una variable, para lo cual se debe incorporar al sistema la rutina correspondiente (ver Apéndice 1).

Para cada estadística que se selecciona se define optativamente una variable de la memoria de trabajo donde se almacenarán los valores de ella para cada muestra (procedimiento visto en ).

h) En el caso de generación de más de una muestra el computador obtiene internamente los valores aleatorios correspondientes y presenta en pantalla las estadísticas seleccionadas en g), para cada muestra, así como almacena dichas estadísticas en las variables establecidas de la memoria de trabajo. En este caso no se presentan ni almacenan los valores individuales generados en cada muestra.

Como ejemplo de los pasos descriptos se realizan dos procesos de generación. El primero de ellos considera la obtención de una muestra de valores aleatorios de una distribución Log-normal, con los parámetros ajustados en la sección anterior a los datos de PBN/Cápita, mostrándose los resultados obtenidos en el Cuadro 13.5 a . Los cálculos efectuados para el primer valor generado son:

r1 = .1213501 r2 = .651861

x' = 0.5189* -2*ln(.1213501) * cos(6.2832*.651861)+7.2531

= 6.636766

x = exp(6.636766) = 762.625

Como segundo ejemplo se realiza la generación de 50 muestras de 20 valores cada una de una distribución Exponencial con = 2. En este segundo caso se obtienen, para cada muestra, las siguientes estadísticas:

- Valor Medio

- Desvío Estándar

- Estadística t

- Estadística Chi2 resultante de un proceso de ajuste de los valores aleatorios a la misma distribución usada para generarlos. Para el cálculo de esta estadística se incorpora al sistema una rutina específica, cuyo listado se incluye en el Cuadro 13.5 c . Los límites de intervalos de clasificación definidos para el ajuste son 0,1,2.

La primera muestra de valores aleatorios generados resulta:

0.281-0.630-0.449-5.216-1.425-1.577-4.465-0.102-0.702-1.263

0.059-2.273-0.089-0.135-1.251-1.144-0.797-0.706-0.600-0.810

- Con ella se obtienen los siguientes valores de las estadísticas involucradas:

x = 23.974 / 20 = 1.1987

s = (1/19)*(64.656 ' (23.974)2/20 = 1.37493

t = (1.1987 - 2)* 20 /1.37493 = -2.606

x Frec.Real Frec.Teórica


0 5 6 4.4

0.5 1 6 3.46

1 1.5 4 2.69

1.5 2 1 2.09

2 3 7.36


Chi2 = (6 - 4.4)2/4.4 + ... + (3 - 7.36)2/7.36

= 6.236

Los resultados del proceso de generación se incluyen en el

Cuadro 13.5 b.

CUADRO 13.6 - DISTRIBUCIONES CONTINUAS

Nomenclatura

Valor Esperado y Desvío Estándar de la distribución.

x, s Valor Medio y Desvío Estándar de una muestra de valores experimentales de una variable.

r Coeficiente de correlación entre dos variables, o de autocorrelación para una serie de tiempo.

u valor aleatorio uniforme en el intervalo 0-1.


1. DISTRIBUCION UNIFORME CONTINUA

Intervalo de x

a <= x <= b

Parámetros

. a

. b ( >a )

y = (a+b)/2 = (b-a)/ 12

Funciones de Probabilidad f(x) = 1/(b-a) F(x) = (x-a)/(b-a)

Estimación de Parámetros a = x - 3s b = x + 3s

Generación de valores x = a + (b-a)u


2. NORMAL

Intervalo de x

< x <

Parámetros

.

. ( >0 )

y coinciden con los parámetros de la distribución

Funciones de Probabilidad f(x)=(1/ 2 ) exp( -.5((x- )/ )2 )

No existe la F(x) en forma explícita. Se considera la siguiente función aproximante, con un error máximo de 10-6:

F'(x)=1- f(x) (.3193815z-.3565638z2+

+1.781478z3-1.821256z4+1.330274z5 siendo:

z=1/(1+.2316419 y)

y=(x- )/

Si y>0: F(x)=F'(x)

Si y<0: F(x)=1-F'(x)

Estimación de Parámetros = x = s

Generación de Valores Se generan simultàneamente dos valores aleatorios:

x1= -2 ln(u1) cos(2 u2) +

x2= -2 ln(u1) sen(2 u2) +


3. EXPONENCIAL

Intervalo de x

<= x <

Parámetro

. ( >0 )

y coincide con el parámetro de la distri- bución.

=

Funciones de Probabilidad f(x)=(1/ ) exp(-x/ ) F(x)=1 - exp(-x/ )

Estimación de Parámetros = x ( debe ser >0 )

Generación de Valores x = - ln(u)


4. DISTRIBUCION GAMMA

Intervalo de x

x>=0

Parámetros

. >0

. >0

Si = Entero: Distribución Erlang

y = =

Funciones de Probabilidad f(x) = - x -1 exp(-x/ ) / ( )

F(x)=(exp(-x)x / ( )) ( )xn/ ( +1+n) siendo:

( ) = Función Gamma

= t -1 exp(-t) dt ( >0)


Esta función se aproxima mediante una expansión en serie.

Estimación de Parámetros = x2 / s2 = x /

Generación de Valores 0 < < 1


b = (e + )/e

1) Generar u1 P=bu1

Si P>0 ir a 3), en caso contrario ir a 2).


2) y=P1/ Generar u2

Si u2<=exp(-y): x'=y (fin) caso contrario ir a 2).

3) y=-ln((b-P)/ ) Generar u2

Si u2<=y -1 x'=y (fin) caso contrario ir a 1). = 1

Coincide con la distribución Exponencial

> 1

1) Generar u1, u2

2) v = a ln(u1/(1 - u1) )

y= exp(v) z= (u1)2u2

w= b+qv-y

siendo:

a=(2 -1)-1/2 b= - ln(4)

q = + 1/ d=1+ln(4.5)

3) Si w+d-4.5z>=0

o si w>=ln(z): x'= y (fin)

en caso contrario ir a 1).


Para todos los casos

x = x'


5. DISTRIBUCION BETA

Intervalo de x

0 <= x <= 1

Parámetros

. > 0

. > 0

y = / ( + )

= /( + )2( + + 1)

Funciones de Probabilidad f(x) = x -1 (1-x) -1 / B( , )

siendo:

B( , ) = función beta

= t -1(1-t) -1 dt

= ( ) ( ) / ( + )

No existe una expresión explícita de F(x). Se aproxima

mediante una expansión en serie de la integral de f(x).

Estimación de Parámetros = x (x - x2 - s2)/s2

= (1/x - 1)

Generación de Valores x = xG1 / (xG1+xG2)

siendo:

xG1 = valor aleatorio de una distribución Gamma con parámetros y 1.

xG2 = valor aleatorio de una distribución Gamma con parámetros y 1.


6. DISTRIBUCION LOGNORMAL

Intervalo de x

0 < x <

Parámetros

. '

. ' ( >0 )

y = exp( '+ '2/2) = ' exp( '2)-1

Funciones de Probabilidad f(x)=(1/x ' 2 ) exp(-.5((ln(x)- ')/ ')2)

No existe una expresión explícita de F(x). Se calcula un valor específico de ella, para un valor x dado, haciendo:

x' = ln(x)

F(x) = FNORMAL(x')

con parámetros ' y '.

Estimación de Parámetros ' = .5 ln(x2/(s2/x2+1))

' = ln(s2/x2+1)

Generación de Valores Se genera un valor x' normal con parámetros ' y

' y se hace:

x = exp(x')


7. DISTRIBUCION CHI2

Intervalo de x

0 <= x <

Parámetro

. k (Entero>0)

y = k = 2k

Funciones de Probabilidad f(x)=x(k/2-1) exp(-x/2)/(2k/2 (k/2 - 1)!)

No existe una función explícita de F(x). Para su cálculo se considera la relación entre la distribución Chi2 y la Gamma:

FCHI(x) = FGAMMA(X/2)

con parámetros =k/2, =1

Estimación de Parámetros k = redondeo a entero de x (k debe ser >0)

Generación de Valores Se generan valores de una distribución Gamma con parámetros =k/2 y =1.


8. DISTRIBUCION "t"

Intervalo de x

- < x <

Parámetro . k (Entero >0 )

y = 0 = k / (k-2) (k>2)

Funciones de Probabilidad f(x)=((k-1)/2)!/

( k((k-2)/2)!(1+x2/k)((k+1)/2)


No existe una función F(x) explícita. Se considera la siguiente relación:

Ft(t) = 1-FBETA( k/(k+t2) )

=k/2, =1/2)

si t<0: Ft(t) = 1-Ft(t)

Para k>= la distribución se aproxima mediante la Normal, con parámetros =0, =1.

Estimación de Parámetros k=redondeo a entero de (2s2/(s2-1))

( k deber ser >2 )

Generación de Valores x = u/ (xCHI/k)


siendo xCHI un valor aleatorio de una distribución Chi2 con parámetro k.

Para k>= se generan dierctamente valores de una distribución normal con =0, =1.


9. DISTRIBUCION "F"

Intervalo de x

0 <= x <

Parámetros

. k1 (Entero >0)

. k2 (Entero >0)

y =k2/(k2-2) (k2>2)

=k2 2(k1+k2-2)/(k1(k2-2)2(k2-4)) ( k2>4 )

Funciones de Probabilidad f(x)=((k1+k2-2)!/((k1-k2)/2)!((k1-2))!

(k1/k2)k1/2 x((k1-2)/2) (1+k1x/k2)(k1+k2)/2

No existe una función F(x) explícita. Se utiliza la relación:

FF(x) = 1 - FBETA( k2/(k2+k1x) ) =k2/2, =k1/2)

Estimación de Parámetros

Generación de Valores x = (x1/k1)/(x2/k2) siendo x1 y x2 valores aleatorios de distribuciones Chi2, con parámetros k1 y k2, respectivamente.


10. NORMAL AUTOCORRELACIONADA

Intervalo de x

- < x <

Parámetros

.

. (>0)

. ( 0 < < 1)

y Coinciden con los parámetros

Funciones de Probabilidad f(x) y F(x) Idem distribución normal

La ley de los coeficientes de autocorrelación es lineal decreciente:


Estimación de Parámetros = x

= s

= r1 (Primer coeficiente de autocorrel.)

Generación de Valores x = (y - 10)/1.291 +

siendo: y = ui

ui : valores aleatorios uniformes (0-1). Para

cada valor x a generar se obtienen n-k valores ui nuevos y se

usan los k últimos valores de la generación anterior.

k=Redond. a entero de (n )


11. DISTRIBUCION NORMAL BIDIMENSIONAL

Intervalo de x e y

- < x <

- < y <

Parámetros

. x, y

. x, y (>0)

. (-1 < < 1)

y Coinciden con los parámetros de la distribución.

Considerando la distribución condicional de una de las variables, por ejemplo la X dado un valor específico y de la otra, las estadísticas son:

x/y = x+ ( x/ y)(y- y)

x/y = x 1 - 2

Funciones de Probabilidad f(x,y)=

La función de densidad condicional, por ejemplo, de x dado y resulta:

f(x/y) =

No existe una función F(x,y) explícita. Para la función de probabilidad acumulada condicional se utiliza la función aproximante consignada para la distribución Normal unidimensional, utilizando como parámetros a x/y y x/y.

Estimación de Parámetros x = x y = y

x = sx y = sy

= rxy

Generación de Valores Los valores de y se generan mediante una distribución normal con parámetros y y y. El valor de x correspondiente a cada valor de y se genera mediante una distribución normal con parámetros x/y y x/y.


CUADRO 13.7 - DISTRIBUCIONES DISCRETAS


12. UNIFORME DISCRETA

Intervalo de x

a <= x <= b

Parámetros

. a (Entero)

. b (Entero > a)

y = (a + b)/2 = (b-a)(b-a+2)/12

Funciones de Probabilidad p(x) = 1/(b-a+1)

F(x) =

Estimación de Parámetros a = xMIN b = xMAX

siendo xMIN y xMAX los valores mínimo y máximo de los datos considerados, respectivamente.

Generación de Valores x = Parte Entera de ( (b-a+1)u+a ) Para generar valores sin reposición, es decir, que cada valor posible entre a y b sea elegido una sola vez, se genera un vector con los b-a+1 valores posibles, del que se extraen valores al azar que son eliminados del vector.


13. BINOMIAL

Intervalo de x

0 <= x <= n

Parámetros

. n (Entero>0)

. p (0 < p < 1)

y = np = np(1-p)

Funciones de Probabilidad p(x) = (n!/x!(n-x)!) px (1-p)n-x

F(x) = p(k)

Para np>5 (si p<=.5) o para n(1-p)>5 (si p>.5) la distribución se aproxima, en términos discretos, a la Normal. En consecuencia, resulta:

p(x) = FN(x+0.5) - FN(x-0.5)

correspondiendo FN() a una Normal con parámetros y dados por las expresiones anteriores.

Estimación de Parámetros n = Redondeo a Entero de ( x2/(x-s2) )

(debe ser n>0)

p = x/n (debe ser p>0)

Generación de Valores x = ki

donde ki = 1 , si ui<=p

= 0 , si ui> p

es decir que se generan n números aleatorios uniformes ui, resultando x la cantidad de ellos que son menores o iguales a p.

Si se dan las condiciones de validez de la aproximación Normal se pueden generar directamente valores de esa distribución, redondeándolos al entero más próximo.


14. BINOMIAL NEGATIVA

Intervalo de x

0 <= x <

Parámetros

. r (Entero>0)

. p (0<p<1)

Para r=1 es la distribución Geométrica.

Considerando como variable x'= es la distribución Pascal.

y = r(1-p)/p = r(1-p)/p

Funciones de Probabilidad p(x)=((x+r-1)!/x!(r-1)!) pr (1-p)x

F(x) = pr ((k+r-1)!/k!(r-1)!) (1-p)k

Estimación de Parámetros r = Redondeo a Entero de ( x2/(s2-x))

(debe ser r>0)

p = x/s2 (debe se 0 < p < 1)

Generación de Valores Se generan valores aleatorios uniformes ui necesarios para que se obtengan r valores tales que ui<=p y el valor de x es el número de veces en que ui>p .


15. POISSON

Intervalo de x

0 <= x <

Parámetro

. (>0)

y coincide con el parámetro de la distri- bución

Funciones de Probabilidad p(x) = exp(- ) x/x!

F(x) = exp(- ) k/k!

Para >=10 se aplica una aproximación Normal, en términos discretos. En ese caso p(x) resulta:

p(x) = FN(x+0.5) - FN(x-0.5)

donde FN() corresponde a una distribución Normal con los parámteros y anteriores.

Estimación de Parámetros = x

Generación de Valores Se obtiene un valor aleatorio x generando valores aleatorios uniformes ui hasta que su producto supere el valor exp(- ). Es decir, hasta que se cumpla la condición:

u1u2..ui..ux>=

exp(- )>u1u2..ui..ux+1

El valor resultante x es el número de valores ui generados menos 1.

Cuando se dan las condiciones para ello, se generan valores mediante la aproximación normal.