Muestreo y estadística inferencial de Educalive

Documento de Educalive sobre muestreo. El Pdf, de nivel universitario, aborda conceptos fundamentales de estadística inferencial, incluyendo distribuciones muestrales de la media y la proporción, con ejemplos prácticos para el cálculo de probabilidades en Matemáticas.

Ver más

22 páginas

Visualiza gratis el PDF completo

Regístrate para acceder al documento completo y transformarlo con la IA.

Vista previa

MATEMÁTICAS

INFERENCIA ESTADÍSTICA

MUESTREO

educalive®

Y998 888

+348

Júli §

Seguro que en más de una ocasión has escuchado en la televisión que tal programa ha tenido una cuota de pantalla del 5% o que un 20% de los españoles opinan algo sobre un tema concreto. Y quizá has pensado que a ti nadie te ha preguntado así que igual esos datos no son demasiado fiables. Sería muy complicado averiguar que vieron anoche en la televisión (si es que vieron algo) casi 50 millones de personas o preguntarles a todos ellos a quien tienen intención de votar en las próximas elecciones.

1

Lo que se hace en estadística es extraer información de una muestra que después generalizaremos a la población total. Utilizamos el término población para referirnos al total de elementos que queremos investigar y hablamos de muestra para referirnos a una parte representativa de la población. Sobre la muestra realizaremos el estudio estadístico. Los valores que se refieren a la totalidad de la población (que son los que queremos estimar) son los parámetros poblacionales y suele utilizarse el alfabeto griego para ellos: u (media poblacional), o2 (varianza poblacional), o (desviación típica poblacional) ... Los valores obtenidos a partir de los datos de la muestra son los estadísticos muestrales: x (media muestral), s2 (varianza muestral), s (desviación típica muestral) ...

El problema a la hora de estudiar una población completa no siempre es de cantidad. En ocasiones no se puede estudiar toda la población porque supondría destruirla por completo. Por ejemplo, cuando queremos estudiar la durabilidad de un aparato producido por una determinada empresa. La población en ese caso sería el total de aparatos producidos por esa empresa y, evidentemente, no tiene sentido estudiar cuánto duran todos y cada uno de los aparatos producidos porque acabaríamos con todos ellos durante el estudio.

1MATEMÁTICAS

INFERENCIA ESTADÍSTICA

educalive®

Así que el muestreo tiene múltiples ventajas: costes reducidos, mayor rapidez, posibilidad de realizar estudios que sobre toda una población no serían factibles, etc. Ahora bien, la elección correcta de la muestra al estudiar una variable es fundamental para que los datos sean fiables. Será importante cumplir algunos requisitos indispensables que podrán variar en función de la situación en la que nos encontremos.

29928 00M

5348 8659

Por ejemplo, si queremos estimar los resultados de las próximas elecciones la muestra deberá incluir personas de ambos sexos, de un amplio rango de edades, de todas las Comunidades Autónomas, con diferente nivel de estudios, ocupación ...

La muestra, por tanto, deberá ser representativa de la población estudiada. Es importante tener claro que por muy bien elegida que esté nunca vamos a tener total conocimiento de la población. Es por ello por lo que en estadística se habla siempre de probabilidad o de nivel de confianza al extraer conclusiones.

REPRESENTATIVIDAD DE LA MUESTRA

Hay dos factores fundamentales que van a tenerse en cuenta para valorar si los resultados obtenidos con la muestra serán válidos o no: el tamaño de la muestra y la forma de seleccionarla.

Tamaño de la muestra

Es evidente que una muestra demasiado pequeña no nos dará resultados fiables. Por ejemplo, si queremos estudiar la cantidad de hijos que tienen las familias españolas y elegimos una sola familia para ver cuántos hijos tiene, el resultado no nos llevará a ninguna conclusión válida.

Lo que no es tan evidente es que un tamaño muy grande pueda aportar mejores resultados. La lógica nos indica que sí, pero dependerá en gran medida de que la muestra se haya elegido correctamente. Además, una muestra demasiado 2educalive®

INFERENCIA ESTADÍSTICA

grande implica costes más elevados (tanto económica como laboralmente) por lo que es importante encontrar un equilibrio entre los costes requeridos y la validez de los resultados que obtengamos.

Forma de elegir la muestra

Júlig

La forma de seleccionar una muestra más importante es el muestreo aleatorio. En este tipo de muestreo todos los elementos de la población tienen las mismas posibilidades de ser elegidos para el estudio. Cuando no se escogen los elementos de forma aleatoria se dice que la muestra es sesgada ya que no representa al total de la población.

Las muestras sesgadas se han escogido de forma parcial o subjetiva. Es lo que ocurre, por ejemplo, con las encuestas telefónicas. Si para un determinado estudio se utiliza la vía telefónica se está excluyendo a cualquier individuo que no disponga de teléfono. En este tipo de muestras, aumentar el tamaño de la misma no proporciona datos más fiables ya que lo único que hacemos es repetir el error cometido durante el muestreo a mayor escala.

Por tanto, para que los resultados obtenidos a partir de una muestra sean válidos la muestra debe tener un tamaño adecuado y tiene que haber sido elegida de forma aleatoria. En este caso diremos que la muestra es representativa y lo ideal será que el tamaño sea el máximo posible (dentro de los costes aceptados).

TIPOS DE MUESTREO

Aunque ya hemos comentado que el muestreo ideal debe ser aleatorio, existen diferentes formas de llevarlo a cabo. Incluso puede darse el caso de que el muestreo no sea aleatorio. A continuación, vamos a analizar los distintos tipos de muestreos.

3educalive®

INFERENCIA ESTADÍSTICA

Muestreo aleatorio simple

Todos los elementos de la población pueden ser elegidos con la misma probabilidad.

Ejemplo ...

199

+348

Júlia gardy

Elegir al azar a varios ciclistas de una carrera para un control antidopaje. Se pueden utilizar sorteos, programas informáticos que después de numerar a los individuos los escogen de forma aleatoria ...

Muestreo aleatorio sistemático

Los elementos de la población se ordenan y, una vez hecho esto, se escoge al azar un elemento de la población y se completa la muestra eligiendo elementos separados por intervalos constantes. Cuando el listado de los elementos de la población se ha realizado al azar, el muestro aleatorio simple y el sistemático son equivalentes.

Ejemplo ...

Elegir a uno de los ciclistas al llegar a meta para el control antidopaje y, a partir de ahí, seleccionar a otro corredor cada 10 ciclistas.

Muestreo aleatorio estratificado

Se utiliza, principalmente, cuando la característica estudiada varía dependiendo del grupo en el que se encuentra el individuo (edad, sexo, religión, nacionalidad ... ).

La población se divide en grupos homogéneos llamados estratos (hombres y mujeres, grupos por edades ... ) de los que se elegirá una muestra de forma aleatoria. Es importante que se mantenga la proporción presente en la población.

4educalive®

INFERENCIA ESTADÍSTICA

Ejemplo ...

Se quiere estudiar el estado de salud de la población. Se divide en estratos según la edad: niños, jóvenes, adultos, tercera edad. De cada uno de estos subgrupos se elige una muestra siguiendo muestreo aleatorio simple. La proporción de niños / jóvenes / adultos / tercera edad presente en la población debe mantenerse en la muestra.

3 8 87 836

@ia Hlang y

Muestreo aleatorio por conglomerados o áreas

Se divide la población en varios grupos llamados conglomerados o áreas. Se eligen al azar uno o varios de estos conglomerados y sus elementos formarán la muestra. Una de las formas típicas de dividir en conglomerados es la división geográfica.

Ejemplo ...

Se quiere estudiar el nivel académico de los alumnos de bachillerato de un país. Las diferentes ciudades serían los distintos conglomerados. Se seleccionarán solo algunos de ellos para la muestra. Dentro de los alumnos de bachillerato de las ciudades elegidas también puede estudiarse solo una muestra escogida por muestreo aleatorio simple o sistemático o considerar que cada instituto es un nuevo conglomerado y elegir solo alguno/s de cada ciudad (muestra por conglomerado en dos etapas).

Muestreos no aleatorios

No siempre es posible trabajar con muestras escogidas de forma aleatoria. O por comodidad o cuestiones económicas no merece la pena. El ejemplo típico son las encuestas a pie de urna que se realizan en las elecciones.

5educalive®

INFERENCIA ESTADÍSTICA

DISTRIBUCIONES MUESTRALES

Como hemos visto, a la hora de estudiar una variable determinada sobre una población, lo que hacemos es evaluar esa variable sobre muestras extraídas de la población total. Si consideramos todas las posibles muestras de tamaño n de una población, para cada una de ellas podremos calcular un estadístico muestral (media muestral, proporción muestral, desviación típica muestral ... ). Para cada uno de estos estadísticos se puede obtener una distribución muestral con los valores de ese estadístico en cada una de las muestras: distribución muestral de la media, distribución muestral de la proporción ...

Si el tamaño de la muestra es suficientemente grande las distribuciones muestrales serán normales (incluso aunque la población no lo sea).

Distribución de la media muestral

Lo que se pretende mediante la distribución de una media muestral es explicar la relación que guardan los estadísticos y los parámetros, es decir, las relaciones entre las medias calculadas en las muestras (x) y la media calculada en la población (u).

Ejemplo ...

La Dirección General de Tráfico desea conocer el peso de la carga que transportan los turismos que circulan por las carreteras en una operación salida.

La carga media de los turismos se denota por u, y la desviación típica por o. Con el fin de tener una idea aproximada de cuánto puede valer u, se elige una muestra aleatoria de 100 turismos y se obtiene que:

1 .- El peso medio muestral es x1 = 68,5 kg

2 .- La desviación típica de la muestra es s1 = 12,6 kg

6educalive®

INFERENCIA ESTADÍSTICA

Si se eligen otras muestras de tamaño 100 y se calculan sus medias y desviaciones típicas, se obtienen otras medias, x2, X3 ... y otras desviaciones típicas, S2, S3 ...

Los diferentes valores de x¡ que se obtienen en cada una de las muestras dan lugar a una variable aleatoria que se representará por x y que se denomina estadístico.

La distribución de los valores de x se llama distribución en el muestreo de la media.

Para poder calcular la distribución de la media muestral, observamos que x sigue una normal:

Z

0

Ejemplo ...

Las alturas de los jugadores de la liga ACB de baloncesto siguen una distribución normal de media 196 cm y desviación típica de 9,5 cm. Se elige al azar una muestra de 45 jugadores de esa liga. Halla la probabilidad de que la media sea mayor que 2.

x sigue una normal N (H,;),

por tanto:

N (196,-

9,5

= N(196; 1,42)

145/

Z =

x-196

1,42

es una normal N (0, 1).

P(x>200) = P(Z>

z>200-19

200 - 1961

1,42

= P(Z > 2,82) = 1 - P(Z ≤ 2,82)

= 1 -0,9976 = 0,0024

7

Y998 7889M

+

9 87ª86581

Jus & Hatdy

¿Non has encontrado lo que buscabas?

Explora otros temas en la Algor library o crea directamente tus materiales con la IA.