CAPÍTULO 7 INFERENCIA ESTADÍSTICA - UPRAg

[Pages:48]CAP?TULO 7

INFERENCIA ESTAD?STICA

La Inferencia Estad?stica comprende los m?todos que son usados para obtener conclusiones de la poblaci?n en base a una muestra tomada de ella. Incluye los m?todos de estimaci?n de par?metros y las pruebas de hip?tesis. En la estimaci?n de par?metros la idea es hallar un estimado del par?metro poblacional usando una muestra aleatoria tomada de la poblaci?n. Uno espera que el estimado est? lo m?s cerca posible del par?metro. Por ejemplo la media muestral estima la media poblacional.

La Estimaci?n de par?metros comprende a su vez la Estimaci?n Puntual, en donde se estudian los diversos m?todos de encontrar estimadores y las propiedades ?ptimas que deben tener ?stos, y la Estimaci?n por Intervalos de Confianza, en donde se estima un par?metro usando un intervalo centrado en un estimado del par?metro y de longitud igual a dos veces el error de estimaci?n. El Error de estimaci?n depende del nivel de confianza deseado, usualmente, 90, 95 ? 99 por ciento.

En este texto solamente se tratar? el c?lculo de intervalos de confianza. Los diversos m?todos de encontrar estimadores y las propiedades de estimadores ?ptimos son discutidos en un curso de Estad?stica Matem?tica.

Una Hip?tesis Estad?stica es una afirmaci?n que se hace acerca de un par?metro poblacional. Por ejemplo, el tiempo de vida promedio para una persona diagnosticada con c?ncer de pulm?n es 180 d?as. El porcentaje de personas que favorecen a un candidato a la presidencia es 60%.

La afirmaci?n que est? establecida y que se espera sea rechazada despu?s de aplicar una prueba estad?stica es llamada la hip?tesis nula y se representa por Ho.

La afirmaci?n que se espera sea aceptada despu?s de aplicar una prueba estad?stica es llamada la hip?tesis alterna y se representa por Ha.

Una prueba estad?stica es una f?rmula, basada en la distribuci?n del estimador del par?metro que aparece en la hip?tesis y que va a permitir tomar una decisi?n acerca de aceptar o rechazar una hip?tesis nula.

Al igual que una prueba de laboratorio para detectar cierta enfermedad, una prueba estad?stica no es cien por ciento segura y puede llevar a una conclusi?n err?nea. Por ejemplo, no es frecuente pero puede ocurrir que una prueba de sangre para detectar una enfermedad E concluya que una persona sana tiene la enfermedad E, o que una persona no tiene la enfermedad E cuando en realidad si la tiene.

Edgar Acu?a

Cap?tulo 7 Inferencia Estad?stica

149

Hay dos tipos de errores que pueden ocurrir. El error tipo I, que se comete cuando se rechaza una hip?tesis nula que realmente es cierta y el error tipo II que se comete cuando se acepta una hip?tesis nula que realmente es falsa.

El nivel de significaci?n, representada por , es la probabilidad de cometer error tipo I, y por lo general se asume que tiene un valor de .05 ? .01. Tambi?n puede ser interpretado como el ?rea de la regi?n que contiene todos los valores posibles de la prueba estad?stica para los cuales la hip?tesis nula es rechazada.

La probabilidad de cometer error tipo II, representado por y al valor 1- se le llama la potencia de la prueba. Una buena prueba estad?stica es aquella que tiene una potencia de prueba alta.

En este cap?tulo, primero se discutir? el c?lculo de intervalos de confianza y pruebas de hip?tesis para la media poblacional, para una proporci?n y finalmente para la varianza de una poblaci?n. Luego se tratar?n los intervalos de confianza y prueba de hip?tesis para la raz?n de dos varianzas poblacionales, para la diferencia de dos medias poblacionales y por ?ltimo para la diferencia de dos proporciones.

7.1 Inferencias acerca de la Media Poblacional (varianza conocida).

Supongamos que de una poblaci?n normal con media desconocida ? y varianza

conocida 2 se extrae una muestra de tama?o n, entonces de la distribuci?n de la media

muestral x se obtiene que:

Z=

x-

?

n

se distribuye como una normal est?ndar. Luego P(- Za / 2 < Z < Z a / 2 ) = 1 - . Donde Z/2 es el valor de la normal est?ndar tal que el ?rea a la derecha de dicho valor es /2, como se muestra en la siguiente figura:

Figura 7.1. Relaci?n de /2 y Z/2 en la curva normal est?ndar

Edgar Acu?a

Cap?tulo 7 Inferencia Estad?stica

150

Sustituyendo la f?rmula de Z se obtiene:

P(- Z / 2 <

x-

?

<

Z /2 ) = 1-

n

Haciendo un despeje algebr?ico, se obtiene

P( x - Z/2 / n < ? < x + Z/2 / n ) = 1 -

Notar que los dos extremos del intervalo son aleatorios. Si se toma una muestra aleatoria y se calcula su media entonces los extremos del intervalo dejan de ser aleatorios y ya no se puede hablar de probabilidad sino de confianza. De lo anterior se puede concluir que un Intervalo de Confianza del 100 (1-) % para la media poblacional ?, es de la forma:

x - Z/2 / n , x + Z/2 / n

Usualmente = .1, .05 ? .01, que corresponden a intervalos de confianza del 90, 95 y 99 por ciento respectivamente. La siguiente tabla muestra los Z/2 m?s usados.

Nivel de Confianza 90 95 99

Z/2

1.645 1.96 2.58

Usando MINITAB se pueden hallar intervalos de confianza y hacer prueba de hip?tesis para ?. Para esto se sigue la secuencia Stat Basic Statistics 1-sample Z

Ejemplo 7.1 Un cardi?logo desea hallar un intervalo de confianza del 90% para el nivel colesterol promedio de todos los pacientes que presentan problemas cardiacos. Para esto asume que la distribuci?n de los niveles de colesterol es normal con una desviaci?n

estandar = 13 y usa la siguiente muestra al azar de niveles de colesterol de 20 pacientes con problemas cardiacos.

217 223 225 245 238 216 217 226 202 233 235 242 219 221 234 199 236 248 218 224

Soluci?n: Despu?s de entrar los datos en la columna colesterol, la ventana de di?logo ser? completada como lo muestra la siguiente figura:

Edgar Acu?a

Cap?tulo 7 Inferencia Estad?stica

151

Figura 7.2. Ventana de di?logo de 1-sample Z para el Ejemplo 7.1

No se escribe nada en la ventanita Test mean. Luego hay que oprimir el bot?n Options para entrar el nivel de confianza como lo muestra la siguiente figura:

A?n cuando en Alternative aparece not equal, MINITAB s?lo calcular? el Intervalo de confianza tal como aparece en la ventana session:

One-Sample Z: colesterol The assumed standard deviation = 13

Variable

N

Mean StDev SE Mean

90.0 % CI

colester 20 225.90 13.09

2.91 ( 221.12, 230.68)

Edgar Acu?a

Cap?tulo 7 Inferencia Estad?stica

152

Interpretaci?n: Hay un 90% de confianza de que el nivel de colesterol de todos los pacientes con problemas card?acos caiga entre 221.12 y 230.68.

En la pr?ctica si la media poblacional es desconocida entonces, es bien probable que la

varianza tambi?n lo sea puesto que en el c?lculo de 2 interviene ?. Si ?sta es la situaci?n, y si el tama?o de muestra es grande (n > 30, parece ser lo m?s usado), entonces 2 es estimada por la varianza muestral s2 y se puede usar la siguiente f?rmula para el intervalo de confianza de la media poblacional:

x - Z/2 s/ n , x + Z/2 s/ n

Ejemplo 7.2 Supongamos que la distribuci?n de los puntajes en la prueba de aprovechamiento matem?tico del College Board de los estudiantes admitidos a cierta universidad en 1994 se comportan normalmente. Se extrae una muestra de 40 estudiantes que tomaron la prueba y se obtienen los siguientes datos:

Aprovech

658

562

679

731

710

631

663

654

565

654

669

710

720

700

657

721

795

635

617

580

638

642

704

767

641

721

625

694

615

617

623

689

689

683

702

694

729

710

689

741

Hallar un intervalo de confianza del 95% para el puntaje promedio en la prueba de aprovechamiento de todos los estudiantes admitidos a la Universidad.

Soluci?n: Primero, debemos estimar la desviaci?n est?ndar muestral s. Escoga Column Statistics del men? Calc y luego en la ventana de di?logo escoga standard deviation y guarde el resultado en la constante s. En la ventana session se obtendr?:

Column Standard Deviation Standard deviation of aprovech = 51.862

Edgar Acu?a

Cap?tulo 7 Inferencia Estad?stica

153

Seguidamente elija la secuencia StatBasic Statistics1-sample Z y complete la ventana de di?logo 1-sample Z como sigue:

Figura 7.3. Ventana de di?logo de 1-sample Z para el Ejemplo 7.2.

Luego oprima el bot?n Options y en la ventanita Confidence Level entre 95. En la ventana session aparecer? lo siguiente:

One-Sample Z: aprovech

The assumed standard deviation = 51.8617

Variable N

Mean StDev SE Mean

95% CI

aprovech 40 673.100 51.862 8.200 (657.028, 689.172)

Interpretaci?n: Hay un 95% de confianza de que la media del puntaje en la parte de aprovechamiento matem?tico de todos los estudiantes que tomaron el College Board caiga entre 657 y 689 puntos.

Edgar Acu?a

Cap?tulo 7 Inferencia Estad?stica

154

Por otro lado, tambi?n se pueden hacer pruebas de hip?tesis con respecto a la media

poblacional ?. Por conveniencia, en la hip?tesis nula siempre se asume que la media es igual a un valor dado. La hip?tesis alterna en cambio, puede ser de un s?lo lado: menor ? mayor que el n?mero dado, ? de dos lados: distinto a un n?mero dado.

Existen dos m?todos para hacer la prueba de hip?tesis: el m?todo cl?sico y el m?todo del "P-value".

En el m?todo cl?sico, se eval?a la prueba estad?stica de Z y al valor obtenido se le

llama Z calculado (Zcalc). Por otro lado el nivel de significancia , definido de antemano determina una regi?n de rechazo y una de aceptaci?n. Si Zcalc cae en la regi?n de rechazo, entonces se concluye que hay suficiente evidencia estad?stica para rechazar la hip?tesis nula basada en los resultados de la muestra tomada.

Las f?rmulas est?n resumidas en la siguiente tabla:

Caso I

Ho : ?=?0

Ha : ??0

Z=

x- ?o

n

Decisi?n:

Si Zcal < -Z entonces se rechaza Ho

Si |Zcal |>Z/2 entonces se rechaza Ho

Si Zcal >Z entonces se rechaza Ho

Aqu? Z es el valor de la normal est?ndar tal que el ?rea a la derecha de dicho valor es . Recordar tambi?n que puede ser sustitu?do por s, cuando la muestra es relativamente grande (n > 30). Los valores de m?s usados son 0.01 y 0.05. Si se rechaza la hip?tesis nula al .01 se dice que la hip?tesis alterna es altamente significativa y

al .05 que es significativa.

Trabajar s?lo con esos dos valores de simplificaba mucho el aspecto computacional, pero por otro lado creaba restricciones. En la manera moderna de probar hip?tesis se usa una cantidad llamada "P-value".

Nota: El "P-value" llamado el nivel de significaci?n observado, es el valor de al cual se rechazar?a la hipotesis nula si se usa el valor calculado de la prueba estad?stica. En la pr?ctica un "P-value" cercano a 0 indica un rechazo de la hip?tesis nula. As? un "Pvalue" menor que .05 indicar? que se rechaza la prueba estad?stica.

Edgar Acu?a

Cap?tulo 7 Inferencia Estad?stica

155

F?rmulas para calcular "P-value": Depende de la forma de la hip?tesis alterna

i)

Si Ha: ?>?o, entonces P-value = Prob (Z>Zcalc).

ii)

Si Ha: ? ................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download