Estadística en Microcomputadores/Presentación General Pruebas

4.1. PRESENTACION GENERAL

Las pruebas estadísticas son procedimientos que, aplicados a muestras de variables, permiten verificar si las poblaciones a las que ellas corresponden cumplen una cierta hipótesis o modelo, que se postula en cada caso. Su utilidad principal es la de servir de apoyo sistemático a las decisiones que deben tomarse sobre datos obtenidos de un cierto proceso experimental. Los siguientes son ejemplos de posibles hipótesis involucradas en una prueba estadística:

- El valor esperado de una variable es igual a un cierto valor numérico.

- Las poblaciones de dos variables son coincidentes.

- Una variable estadística responde a una cierta distribución de probabilidad (prueba que ya vimos en el capítulo 3).

El sujeto principal de toda prueba estadística está constituido por la hipótesis a verificar, denominada básica o nula. El resultado de la prueba será el rechazo o no de la hipótesis básica, requiriéndose siempre la definición de una hipótesis alternativa, a aceptar en caso de rechazar la primera. De acuerdo a la hipótesis básica a verificar, se define en toda prueba una estadística descriptiva, que denominamos genéricamente xp y que se calcula en función de las observaciones de la muestra (o muestras) involucrada. Una propiedad importante de la estadística xp es que si suponemos que tenemos un conjunto numeroso de muestras, y todas ellas cumplen la hipótesis planteada, el conjunto de valores xp calculados para cada una de ellas responde a una cierta distribución teórica, definida según el tipo de prueba involucrada.

Por ejemplo, la prueba más sencilla, respecto al valor esperado , involucra la siguiente estadística de prueba xp, para una hipótesis básica de que = k:

xp = (x - k) n /s

En el caso de muestras que cumplen la hipótesis planteada dicha estadística sigue una distribución "t" de Student. La propiedad enunciada nos permite establecer una zona de valores de xp, denominada de rechazo, abarcando aquellos valores de la estadística de prueba poco probables si la hipótesis es cierta. Dicha zona se define siempre en el extremo (o extremos) de los valores de xp que tiene las menores probabilidades de ocurrencia:

La probabilidad asociada a la zona de rechazo, calculada mediante las distribución correspondiente a xp, define el riesgo o probabilidad de que rechacemos la hipótesis planteada, siendo ésta cierta. Ello surge del criterio con el que se definió la distribución asociada a xp. Dicha probabilidad de equivocarnos en el rechazo de la hipótesis planteada se denomina usualmente nivel de significación de la prueba.

Cuando una cierta prueba se ejecuta mediante la ayuda de un computador se calcula en primer lugar, dada la muestra (o muestras) involucrada, el valor de la estadística xp correspondiente a la hipótesis a verificar.

Considerando a dicho valor como límite de la zona de rechazo se calcula el nivel de significación correspondiente. Este cálculo se efectúa mediante las expresiones que permiten obtener valores de la función de probabilidad acumulada F(x) para un dado valor de x y una cierta distribución (sección 3.3). Por ejemplo, para el caso de la figura anterior el nivel de significación resulta:

= 1 - F(xp)

siendo F( ) la función de probabilidad acumulada de la distribución asociada a la estadística de prueba definida. Dado que el nivel de significación representa el riesgo de equivocarnos en el rechazo de una dada hipótesis, si el nivel obtenido en una prueba es bajo (usualmente menor al 5%) estamos en condiciones de rechazar la hipótesis básica planteada. Por el contrario, valores altos de implican riesgos altos de equivocarnos en el rechazo, lo que nos estaría llevando a aceptar la hipótesis planteada. En este caso aparece otro riesgo, el de que aceptemos la hipótesis planteada cuando en realidad es cierta una alternativa. A dicho riesgo o probabilidad se lo denomina usualmente .

Considerando una hipótesis alternativa específica dicho riesgo en caso de aceptación también se obtiene mediante el valor de la estadística de prueba calculada para la muestra (o muestras) considerada.

Para ello se parte de que, si la hipótesis alternativa es cierta, la estadística xp responde a una distribución distinta a la anterior, que en la figura siguiente definimos como: f'(xp): Si consideramos la aceptación de la hipotesis básica el riesgo que ello implica es la probabilidad de que xp tome valores dentro de la zona de aceptación definida, probabilidad calculada según la distribución f'(xp). Como vemos en la figura, para una hipótesis alternativa definida, un valor de xp que implica un menor en caso de rechazo corresponde a un mayor en caso de aceptación.

Por otra parte, si tomamos una hipótesis alternativa más diferenciada de la básica, lo que equivale a un alejamiento entre las f(xp) y f'(xp) correspondientes a ambas, disminuye el riesgo para un mismo valor de .

Otra propiedad general en toda prueba estadística es que, para una misma hipótesis alternativa, las funciones f(xp) f'(xp) tienden a disminuir su superposición a medida que aumenta el tamaño de la muestra considerada. Ello determina también una disminución de , para un mismo valor de .

A partir del riesgo en caso de aceptación se establece un concepto importante, el de potencia de una prueba estadística. La potencia de una prueba se define mediante la expresión:

Potencia = 1 -

y establece la probabilidad de rechazar una hipótesis siendo cierta una dada alternativa. Este concepto resulta útil para evaluar la efectividad relativa de pruebas alternativas, cuando existe más de una aplicable para probar una cierta hipótesis. Resultará más efectiva aquella prueba que, para un mismo valor de determine mayores potencias (menores ) que las restantes.

En la mayor parte de las pruebas estadísticas podemos plantear más de una hipótesis alternativa para la misma hipótesis básica, lo que determina a su vez diferencias en el cálculo del nivel de significación . En ese caso, si la hipótesis básica implica que se cumpla una cierta característica de la variable (o variables) considerada, las hipótesis alternativas pueden ser:

a) que la característica sea mayor.

b) que la característica sea menor.

c) que la característica sea distinta.

Las hipótesis alternativas a) o b), que definen pruebas denominadas genéricamente "de un extremo", se eligen cuando se tiene el conocimiento a priori de que la característica involucrada, o toma el valor planteado en la hipótesis básica, o varía en uno u otro sentido, según el caso.

En cambio, la hipótesis alternativa c), que determina pruebas denominadas "de dos extremos", se elige cuando no estamos en condiciones de definir a priori un sentido para sus valores alternativos.

El cálculo del riesgo en una prueba concreta depende de cuál de las hipótesis alternativas se elija, como se resume en la tabla siguiente:

Prueba Región de

Alternativa Rechazo

Caracterist.

alternativa 1 - F(xp)

> carácter.

básica

Caracterist.

alternativa F(xp)

carácter.

básica

Caracteris.

alternativa (1-F(xp))+F(x'p)

= caract.

básica

El cálculo del riesgo , en caso de aceptación, también depende de la hipótesis alternativa que se elija, siempre y cuando su determinación sea posible en forma más o menos directa.

Las pruebas estadísticas pueden dividirse en dos grandes grupos: Paramétricas y No Paramétricas, según que consideren o no a priori que las poblaciones de las variables en estudio siguen ciertas distribuciones teóricas, normal en la mayor parte de los casos.

Dentro de cada uno de estos dos grandes grupos de pruebas podemos a su vez tipificarlas, según el número de variables involucrado, en pruebas sobre una variable, sobre dos variables (independientes o relacionadas) y sobre k variables.

El concepto de prueba estadística, sobre todo dentro de ello el de intervalo de confianza, sirve de base para uno de los temas estadísticos de mayor utilidad: la estimación de propiedades de una o más variables experimentales mediante el muestreo de algunos de sus valores.

El aporte principal del concepto de prueba estadística a este tema es en la determinación de los tamaños de muestra necesarios para obtener determinada precisión en los resultados obtenidos del muestreo.

En las secciones siguientes describiremos para el caso de una o dos variables los dos tipos de pruebas enunciadas, de tipo paramétrico y no paramétrico, así como los aspectos básicos del muestreo estadístico. Las pruebas que involucran k variables entran dentro de un proceso estadístico específico, denominado Análisis de Variancia, que veremos en el capítulo 5. Como aspecto final se considera el tema de Muestreo, que se deriva de los conceptos definidos para las pruebas estadísticas.