Diapositivas de la Universidad de Sevilla sobre Estadística Descriptiva. El Pdf aborda los conceptos fundamentales de la estadística, diferenciando población y muestra, y clasificando variables. Incluye representaciones gráficas como diagramas de barras e histogramas, útiles para el estudio universitario.
Ver más8 páginas


Visualiza gratis el PDF completo
Regístrate para acceder al documento completo y transformarlo con la IA.
En la actividad clínica, tanto en la investigación como en la planificación, se aplican muchos elementos del razonamiento estadístico, aunque los investigadores no sean conscientes de ello. La Estadística como ciencia no se puede reducir a una serie de técnicas más o menos complicadas para el profesional sanitario, sino que ha de entenderse como una interpretación de la realidad. Para ello, el primer paso es la comprensión de cómo se convierte la información en un modelo matemático.
Población, universo o colectivo: Entes (personas u objetos) que son portadores de las características objeto de estudio. Cada elemento de la población se denomina individuo. En relación a su tamaño puede ser finita o infinita.
Muestra: Subconjunto representativo de la población. Se utiliza cuando la población es muy numerosa, infinita o muy difícil de examinar, así como cuando la característica a estudiar es complicada o supone la desaparición del individuo. En el caso en que la muestra coincida con toda la población, se denomina Censo.
Caracteres: Propiedades, rasgos o cualidades que se pretenden estudiar de los elementos de la población. Pueden ser cuantitativos o cualitativos, dependiendo de si son o no susceptibles de ser cuantificados. Esto no significa que, en ocasiones, no se usen valores numéricos para identificar las categorías de una variable cualitativa (por ejemplo, asignar los valores 0-varón, 1-mujer). Este proceso de denomina codificación.
Cada uno de los resultados posibles de una variable cualitativa se denomina modalidad o valor. Cuando una información de tipo cualitativo es no numérica y sus valores no se pueden ordenar se le llama variable cualitativa nominal y, si se puede ordenar se denomina variable ordinal (por ejemplo, el grado de mejoría de un paciente: nulo/leve/moderado/total). Cuando una variable cualitativa sólo tiene dos valores posibles se le denomina dicotómica (si/ no, varón/ mujer, etcétera).
Según la cantidad o tipo de valores que pueden tomar, las variables cuantitativas son discretas (aquellas que no pueden tomar un valor intermedio entre dos consecutivos, como la edad, el número de pulsaciones, etc.) o continuas (las que pueden tomar un número infinito de valores de modo que entre dos cualesquiera puede haber siempre otro, como el nivel de colesterol en sangre, la temperatura, etcétera).
Julio Oliva Contero 1BIOESTADÍSTICA GRADO EN PODOLOGÍA u SEVI
La organización de los datos observados en tablas se va a realizar dependiendo del tipo de característica en estudio.
Si la característica es de tipo cualitativo nominal, la tabla de distribución de frecuencia es:
Variable Frecuencias Frecuencia Porcentaje (pi) cualitativa absoluta (ni) relativa (fi) X1 nı fı Pı X2 n2 f2 P2 · . . · . . · . Xk nk fk Pk n 1 100
Llamamos frecuencia absoluta del valor xi al número de veces que aparece dicho valor en la muestra. Se representa por ni con i = 1, 2, ... , r Nótese que el índice de n no varía como el de x, puesto que no necesariamente tiene que haber tantos valores como observaciones (en este caso, r ≤ N es la cantidad total de valores distintos que toma la variable).
Se verifica que la suma de todas las frecuencias es igual al número total de observaciones:
n= > ni i=1 r
En el caso de las modalidades, no es posible establecer un orden para ellas, por lo que se suelen ordenar según el criterio del investigador.
La frecuencia relativa del valor xi es la proporción de veces que aparece el valor i-ésimo de la variable en proporción al total de observaciones. Se representa por fi:
ni fi = N
Es inmediato observar que la suma de todas las frecuencias relativas es 1, pues supone la proporción de todos los datos frente al total:
Ifi=1 i=1 r
Julio Oliva Contero 2BIOESTADÍSTICA GRADO EN PODOLOGÍA u VILL
Al valor pi se le denomina porcentaje del valor i. Se define como el producto de la frecuencia relativa por 100 Pi = 100fi
La suma de los porcentajes es igual a 100
r 2Pi = 100 i=1
Ejemplo: Sea X la variable "grupo sanguíneo". Se selecciona una muestra de 200 individuos con objeto de estudiar el grupo sanguíneo de los mismos. Los datos observados son los siguientes:
Grupo sanguíneo (X) Frecuencias absoluta (ni) Frecuencia relativa (fi) Porcentaje (pi) A 82 0,41 41 B 18 0,09 9 AB 8 0,04 4 O 92 0,46 46 n=200 1 100
Si la característica es de tipo cualitativo ordinal o discreto, la tabla de distribución de frecuencia es:
Variable Frecuencias Frecuencia Porcentaje Frecuencia absoluta acumulada acumulada (%) (Ni) (Fi) X 1 n 1 fı Pı F P n2 f2 Pz N2 F2 P2 · . · . · . . · . . · X n fk Pk NK=n Fx=1 PK=100 n 1 100 Frecuencia relativa Porcentaje acumulado Cuantitativa absoluta (ni) relativa (fi) (pi) discreta (X)
Las columnas xi, ni, fi , pi, representan los valores, frecuencias absolutas, frecuencias relativas y porcentajes, respectivamente, análogos al caso de la variable cualitativa.
Los valores xi para una variable discreta son numéricos y se tabulan ordenados.
Julio Oliva Contero 3BIOESTADÍSTICA GRADO EN PODOLOGÍA u VILL
La frecuencia absoluta acumulada del i-ésimo valor de la variable X es la suma de todas las frecuencias absolutas de los valores menores o iguales a xi:
i Ni = >nj j=1
Es inmediato observar que NI = n1 y que Nr = n
La frecuencia relativa acumulada del i-ésimo valor de la variable X es la suma de todas las frecuencias relativas de los valores menores o iguales a xi:
i Fi = >f j=1
Es inmediato observar que F1 = fi y que Fr = 1
Análogamente, llamamos porcentaje acumulado de observaciones del i-ésimo valor de la variable X a la suma de todos los porcentajes de los valores menores o iguales a xi:
i Pi = >Pi j=1
Es inmediato observar que P1 = pi y que Pr = 100
Las frecuencias absolutas y relativas acumuladas, así como los porcentajes acumulados sólo se pueden calcular para variables que puedan ser ordenadas, por lo tanto, para variables ordinales y cuantitativas.
Ejemplo: sea X el "nº de hijos varones de familias con 2 hijos"
Nº de hijos Frecuencias Frecuencia Porcentaje Frecuencia Porcentaje acumulado varones (X) absoluta relativa (fi) (pi) Frecuencia absoluta acumulada relativa acumulada (%) (Ni) (Fi) 0 90 0,45 45 90 0,45 45 1 80 0,40 40 170 0,85 85 2 30 0,15 15 200 1 100 n=200 1 100 (ni)
Julio Oliva Contero 4BIOESTADÍSTICA GRADO EN PODOLOGÍA u
En cuanto a las variables cuantitativas, si la muestra obtenida tiene demasiados valores (cuando la muestra es muy grande o los valores son continuos), es más operativo agrupar éstos en intervalos ya que en la práctica pueden obtenerse una gran cantidad de valores distintos entre sí que, al tabularlos, produciría una tabla con un gran número de valores con frecuencias 0 o 1.
Variable ni fi Pi N F Porcentaje Amplitud Marca de clase (Xi) Cuantitativa acumulado (ai) discreta (X) (%) Lo-L1 nı fı Pı NI F1 PI a x L1-L2 n2 f2 P2 N2 F2 P2 a2 X2 · . . . · · · · . . . · · · · · Lk-1-Lk nk fk Pk NK=n FK=1 PK=100 a Xk n 1 100
En caso de agrupación de valores, los intervalos se denominan intervalos de clase. El i-ésimo intervalo se nota por (Li-1, Li], considerándose el primer intervalo el [L0, L1] y coincidiendo el extremo superior de cada intervalo con el extremo inferior del intervalo siguiente.
La longitud de cada intervalo se denomina amplitud, y es la diferencia de los valores extremos, representándose por ai:
ai = Li - Li-1
En este caso, se toma un valor intermedio (normalmente la media aritmética, que es el punto medio) que represente a todo el intervalo. Dicho valor se denomina marca de clase. La agrupación de valores supone cierta pérdida de información, pero hace más manejables los datos.
Ejemplo: sea X la variable "altura"
Altura ni fi Pi Z F. Porcentaje Amplitu Marca de (X) acumulado d (ai) clase (x1) (%) 1,5-1,6 50 0,25 25 50 0,25 25 0,1 1,55 1,6-1,7 80 0,40 40 130 0,65 65 0,1 1,65 1,7-1,8 30 0,15 15 160 0,80 80 0,1 1,75 1,8-1,9 40 0,20 20 200 1 100 0,1 1,85 n=200 1 100
Julio Oliva Contero 5 . . . .BIOESTADÍSTICA GRADO EN PODOLOGÍA DE u SEVILLA
Las representaciones gráficas constituyen una herramienta muy útil para la exposición de la información, ya que proporcionan al investigador una forma sencilla y rápida de acceder a los resultados.
El tipo de representación gráfica dependerá del tipo de información que tengamos disponible, es decir, según la variable sea cualitativa, cuantitativa discreta o continua.
En este caso, el principio de la representación es la proporcionalidad de las áreas a las frecuencias absolutas. Se pueden utilizar diagramas de sectores o diagramas de rectángulos.
Los diagramas de sectores consisten en dividir un círculo en tantos sectores circulares como modalidades presente la variable, asignando un ángulo central a cada sector proporcional a la frecuencia absoluta ni (o a la frecuencia relativa o al porcentaje), y por consiguiente un área proporcional a la frecuencia absoluta (o a la frecuencia relativa o al porcentaje).
grupo_sanguineo 0 10% A AB 5% B 45% 40%
Los diagramas de rectángulos son rectángulos construidos sobre cada carácter, con la misma base y de alturas proporcionales a la frecuencia absoluta del carácter en cuestión. Su superficie es proporcional a su porcentaje.
50 40 Porcentaje 30 20 10 0 0 A AB B Grupo sanguineo
Julio Oliva Contero 6BIOESTADÍSTICA GRADO EN PODOLOGÍA u VILL
El diagrama de barras se utiliza como representación gráfica cuando la variable es cuantitativa discreta. Se obtiene representando unos ejes de coordenadas, en el eje horizontal se señalan los distintos valores de la variable cuantitativa discreta, y en el de ordenadas los porcentajes de cada valor. A partir de aquí se trazan barras, perpendiculares al eje horizontal en cada valor de la variable estadística discreta y de altura el porcentaje de dicho valor. También puede utilizarse la frecuencia absoluta o relativa en el eje de ordenadas.
50 40 Porcentaje 30 20 10 0 2 4 6 8 10 numero de convivientes en la familia
En el caso de las variables cuantitativas continuas, se utilizan dos clases de representaciones gráficas: el histograma y el polígono de frecuencias.
El histograma se construye sobre unos ejes de coordenadas, levantando sobre cada intervalo un rectángulo cuyo área es proporcional a la frecuencia del correspondiente intervalo. Se señalan en el eje horizontal los distintos extremos de los intervalos de clase, y en el eje vertical los porcentajes de cada intervalo. A partir de esto se construyen rectángulos contiguos, cuyas bases son las amplitudes de los intervalos y cuya altura es el porcentaje de cada intervalo del intervalo.
20 15 Porcentaje 10 5 0 20 30 40 50 60 70 edad
Julio Oliva Contero 7