La lógica del contraste de hipótesis en estadística

Diapositivas sobre La Lógica Del Contraste de Hipótesis. El Pdf aborda la lógica del contraste de hipótesis en estadística, explicando conceptos clave como la región crítica, la regla de decisión y la interpretación del p-value, útil para estudiantes universitarios de Matemáticas.

Ver más

16 páginas

LA LÓGICA DEL CONTRASTE DE
HIPÓTESIS
mjcalero
INTRODUCCIÓN
Uno de los usos s extendidos de la estadística es el que se refiere a las
técnicas de análisis de datos que se emplean en investigación científica.
El procedimiento más empleado es el contraste de hipótesis, aunque no está
exento de críticas.
Es un procedimiento para adoptar decisiones categoriales respecto a la
plausibilidad de una afirmación. Estas afirmaciones son las hipótesis que se
quieren estudiar.

Visualiza gratis el PDF completo

Regístrate para acceder al documento completo y transformarlo con la IA.

Vista previa

INTRODUCCIÓN

  • Uno de los usos más extendidos de la estadística es el que se refiere a las técnicas de análisis de datos que se emplean en investigación científica.
  • El procedimiento más empleado es el contraste de hipótesis, aunque no está exento de críticas.
  • Es un procedimiento para adoptar decisiones categoriales respecto a la plausibilidad de una afirmación. Estas afirmaciones son las hipótesis que se quieren estudiar.

VALORANDO LA EVIDENCIA

  • Necesitamos algunos elementos de lógica. Esquemas confirmatorios y esquemas falsacionistas.
  • Ejemplo: supongamos que tenemos dos monedas, A y B. Estamos interesadas en estudiar si realmente son dos monedas imparciales, para su uso en juegos de cara o cruz. Lanzamos 100 veces y obtenemos unas frecuencias de caras/cruces de 50/50 y 90/10, respectivamente. Estas observaciones constituyen la evidencia empírica con la que vamos a razonar respecto a su imparcialidad. Hay dos opciones respecto a la imparcialidad que, por su propia naturaleza, son mutuamente excluyentes y exhaustivas: que la moneda sea imparcial y que no sea imparcial. Estas dos opciones se pueden traducir fácilmente a hipótesis estadísticas.
  • La hipótesis de imparcialidad se traduce en que la probabilidad de cara (y de cruz) es de 0,50, y la de no imparcialidad en que la probabilidad de cara (y de cruz) es distinta de 0,50.
  • Un enfoque confirmatorio intentaría afianzar la credibilidad de una hipótesis buscando evidencia empírica compatible con ella, mientras que un enfoque falsacionista trataría de reducir la credibilidad de una hipótesis buscando evidencia empírica incompatible con ella.

Desde un enfoque confirmatorio una persona podría decir que los resultados de la moneda A avalan la idea de que se trata de una moneda imparcial, dadas las proporciones de cara/cruz (0,50/0,50) son las realmente esperadas si se tratara de una moneda imparcial.

Desde un enfoque falsacionista una persona podría decir que los resultados de B le llevan a creer que se trata de una moneda que no es imparcial, dado que las proporciones de caras/cruces observadas (0,90/0,10) se desvían mucho de lo que esperaríamos si lo fuera.

Un enfoque confirmatorio concluye que una hipótesis es creíble porque lo observado es compatible con ella, mientras que un enfoque falsacionista concluye que una hipótesis no es creíble (probablemente es falsa) porque lo observado es incompatible (en realidad "poco compatible") con ella.

El uso del CH, tal y como se emplea mayoritariamente en ciencia, se basa en el enfoque falsacionista. Este enfoque es mucho más potente, aunque también tiene limitaciones.

Por muchas veces que encontremos evidencia empírica compatible con una hipótesis, nunca podremos estar razonablemente seguros de que es correcta. En cambio, como la evidencia incompatible con una hipótesis es en teoría imposible de ser observada, el hecho de que se haya observado es un argumento muy convincente de su falsedad.

La verosimilitud de la hipótesis "los burros no son capaces de volar" aumenta cada vez que nos acercamos a un burro con ademán amenazante y éste escapa corriendo, en vez de hacerlo volando. Pero esto no es suficiente. Quizás los burros sí tengan esa capacidad, pero no la emplean porque no perciben que yo sea lo suficientemente amenazadora.

Por el contrario, nos bastaría con encontrar un solo burro volador para poder afirmar que la hipótesis es falsa. Un solo ejemplar nos bastaría para valorar negativamente la hipótesis propuesta, concluyendo que los burros sí son capaces de volar, al menos en casos de pánico extremo.

Diferencia fundamental entre la lógica clásica y la estadística inferencial es que la argumentación en la primera es categorial, mientras que en la segunda es probabilística.

Cuando decimos que las proporciones 0,90 / 0,10 son incompatibles con la hipótesis de que la moneda es imparcial, no queremos decir que realmente lo sean de un modo absoluto. Ciertamente una moneda imparcial lanzada 100 veces puede dar este resultado (ocurriría en uno de cada trillón de series de 100 lanzamientos). Lo que quiere decir es que es un resultado tan improbable que, de su observación, es muy razonable deducir que hay una práctica incompatibilidad entre lo observado y lo esperado bajo esa hipótesis ¿Cuál debería ser nuestra conclusión respecto a una moneda que ofrece, por ejemplo, un resultado de 55/45?

Siguiendo con la misma lógica, deberíamos preguntarnos cómo de probable es un resultado como el observado (0,55 / 0,45) si la moneda fuera imparcial. Si esa probabilidad es muy pequeña, concluiremos que la evidencia indica que la moneda no es imparcial, pero si es grande deberemos concluir que el resultado es compatible con la hipótesis de imparcialidad.

En el CH se establece un valor arbitrariamente pequeño para considerar de forma operativa a algo "improbable".

Se suelen considerar como evidencias improbables aquellas cuyas probabilidades son menores de 0,05 o 0,01.

Cuando se produce un resultado como éste se dice que el resultado es estadísticamente significativo.

Elementos de un contraste de hipótesis (HC)

Vamos a señalar cinco elementos, empleando como ejemplo el CH sobre la media poblacional (u). Supongamos que en los años 50 se hizo un estudio en España que determinó que la edad media a la que niñas/os adquieren una determinada destreza era de 10 años, y su desviación típica era de 2,5 (valores de parámetros poblacionales). Una colega nos plantea que, debido a una serie de factores, esa edad media no es correcta para niñas/os actuales. Vamos a hacer un estudio que nos permita alcanzar una conclusión al respecto. La estrategia va a ser recoger información relevante, establecer como hipótesis que la media poblacional es 10, y calcular la probabilidad de haber obtenido la evidencia que, de hecho, hemos recogido si esa hipótesis fuera verdadera. Si esa probabilidad es pequeña, concluiremos que la hipótesis es falsa (la evidencia es incompatible con la hipótesis y el resultado es estadísticamente significativo). Si no es pequeña, mantendremos la hipótesis como una opción plausible. La información relevante la obtenemos seleccionando una MAS de 81 niñas/os y anotando la edad a la que han adquirido esa destreza. Esas edades tienen una media de 10,8 (media muestral o X).

a) HIPÓTESIS

Establecimiento de dos hipótesis relativas a los parámetros, conocidas como hipótesis nula e hipótesis alternativa.

Hipótesis nula (H0) aquella bajo la cual hallamos la probabilidad asociada a la evidencia. Es la que se pretende falsar, mediante la observación de evidencia incompatible (poco probable) con ella. Cuando la probabilidad es muy pequeña concluiremos que es falsa, mientras que si no lo es la mantendremos.

La hipótesis alternativa (H1) es la contraria, o negación de la nula.

En nuestro ejemplo, la Ho establece que la media poblacional (u) es igual a 10. Al valor de la media establecido en la Ho se le representa como po . La hipótesis alternativa, H1, como negación de la anterior, simplemente establece que la media es diferente de 10.

Ho: u=10 H1: u$10

En ocasiones las hipótesis científicas se plantean de forma algo diferente. En este planteamiento se rechaza la H0 cuando la media muestral se aleje del valor planteado en la H0, sin importar que esa media se aleje por ser demasiado grande o demasiado pequeña. Este planteamiento es adecuado cuando no tenemos ninguna expectativa respecto a la dirección de la eventual discrepancia entre el estadístico y el parámetro.

En la investigación científica es habitual que el CH se aplique habiendo una expectativa direccional de la discrepancia.

Estas dos maneras alternativas de plantear los contrastes reciben los nombres de contrastes bilaterales y contrastes unilaterales, respectivamente. En los primeros nos quedamos con una alternativa no direccional, mientras que en los segundos nos quedamos con una alternativa direccional.

En los contrastes unilaterales, la H0 especificará no solo el valor puntual del parámetro, sino toda la zona que incluye los valores de la dirección opuesta a la esperada. En nuestro ejemplo:

Ho: μ$10 H1: u>10

Si se rechaza H0, la alternativa con la que nos quedamos es que especifica la dirección buscada en la discrepancia. Dependiendo de la dirección, se dice que un contraste es unilateral izquierdo o unilateral derecho.

La formulación de las hipótesis en contrastes unilaterales sería:

Unilateral izquierdo: Ho: u≥10 H1:μ< 10

Unilateral derecho: Ho: u≤10 H1: u>10

b) SUPUESTOS

Para poder calcular la probabilidad en la que se basa la decisión hay que asumir que se cumplen determinadas condiciones, llamados supuestos. El procedimiento de obtención de los datos (diseño) será la garantía de ciertos supuestos, otros se podrán comprobar, y otros se asumirán con cierto riesgo. Cuanto más arriesgados sean los supuestos que no se pueden comprobar, menos confiable será el resultado del CH. Se habla de robustez.

En nuestro ej. asumimos que las N observaciones son independientes (parece plausible ya que se ha trabajado con una MAS). También podemos aplicar lo que sabemos de la distribución muestral de la media cuando se conoce la o. No sabemos si la distribución de la variable es normal, pero gracias al teorema central del límite, en muestras moderadamente grandes la distribución muestral de la media se aproxima a la normalidad.

En este esquema nuestros supuestos son los mismos que establecíamos como condiciones al estudiar la distribución muestral de la media cuando se conoce la o y la muestra es grande.

c) Estadístico de contraste y distribución muestral

El estadístico de contraste es una transformación de un resultado muestral que nos resulta un instrumento útil porque su distribución de probabilidad es conocida cuando H0 es verdadera y se cumplen los supuestos. Así podemos calcular la probabilidad asociada a la evidencia.

En nuestro ej. el estadístico es el que define la distribución muestral de la media, conocida la o, para muestras grandes; su distribución se aproxima a la normal unitaria. Su fórmula es la siguiente, en la que el valor paramétrico es sustituido por el que se indica en H0, dado que vamos a calcular una probabilidad bajo H0 verdadera:

z = : x- uo OVN

Su distribución es aproximadamente N(0; 1). Sustituyendo: z = 2,5 V81 10,8 - 10 = 2,88

d) Regla de decisión

Establece el criterio probabilístico que va a conducir a la decisión sobre H0. Dicha regla debe indicar qué con junto de posibles valores del estadístico de contraste (z) son los menos compatibles con H0 y cuya probabilidad conjunta es igual a ese valor de probabilidad que hemos calificado como de "práctica incompatibilidad". A esa pequeña probabilidad en la que se basa la regla de decisión se le llama nivel de significación y se representa por a, mientras que a su complementario (1-a) se le llama nivel de confianza.

En nuestro ej. de contraste bilateral podemos formular la regla de decisión de la siguiente forma:

¿Non has encontrado lo que buscabas?

Explora otros temas en la Algor library o crea directamente tus materiales con la IA.