Estadística Descriptiva: conceptos fundamentales y representaciones gráficas

Diapositivas de la Universidad de Sevilla sobre Estadística Descriptiva. El Pdf aborda los conceptos fundamentales de la estadística, diferenciando población y muestra, y clasificando variables. Incluye representaciones gráficas como diagramas de barras e histogramas, útiles para el estudio universitario.

Ver más

8 páginas

Tema 1: Tipos de datos, tabulación y representaciones gráficas 1
Julio Oliva Contero
BIOESTADÍSTICA GRADO EN PODOLOGÍA
TEMA 1: ESTADÍSTICA DESCRIPTIVA
En la actividad clínica, tanto en la investigación como en la planificación, se aplican muchos elementos
del razonamiento estadístico, aunque los investigadores no sean conscientes de ello. La Estadística
como ciencia no se puede reducir a una serie de técnicas más o menos complicadas para el profesional
sanitario, sino que ha de entenderse como una interpretación de la realidad. Para ello, el primer paso
es la comprensión de cómo se convierte la información en un modelo matemático.
ESTUDIO DE UNA SOLA VARIABLE
Población, universo o colectivo: Entes (personas u objetos) que son portadores de las características
objeto de estudio. Cada elemento de la población se denomina individuo. En relación a su tamaño
puede ser finita o infinita.
Muestra: Subconjunto representativo de la población. Se utiliza cuando la población es muy
numerosa, infinita o muy difícil de examinar, así como cuando la característica a estudiar es
complicada o supone la desaparición del individuo. En el caso en que la muestra coincida con toda la
población, se denomina Censo.
Caracteres: Propiedades, rasgos o cualidades que se pretenden estudiar de los elementos de la
población. Pueden ser cuantitativos o cualitativos, dependiendo de si son o no susceptibles de ser
cuantificados. Esto no significa que, en ocasiones, no se usen valores numéricos para identificar las
categorías de una variable cualitativa (por ejemplo, asignar los valores 0-varón, 1-mujer). Este proceso
de denomina codificación.
Cada uno de los resultados posibles de una variable cualitativa se denomina modalidad o valor.
Cuando una información de tipo cualitativo es no numérica y sus valores no se pueden ordenar se le
llama variable cualitativa nominal y, si se puede ordenar se denomina variable ordinal (por ejemplo,
el grado de mejoría de un paciente: nulo/leve/moderado/total). Cuando una variable cualitativa sólo
tiene dos valores posibles se le denomina dicotómica (si/ no, varón/ mujer, etcétera).
Según la cantidad o tipo de valores que pueden tomar, las variables cuantitativas son
discretas (aquellas que no pueden tomar un valor intermedio entre dos consecutivos, como
la edad, el número de pulsaciones, etc.) o continuas (las que pueden tomar un número
infinito de valores de modo que entre dos cualesquiera puede haber siempre otro, como el
nivel de colesterol en sangre, la temperatura, etcétera).
Tema 1: Tipos de datos, tabulación y representaciones gráficas 2
Julio Oliva Contero
BIOESTADÍSTICA GRADO EN PODOLOGÍA
TABULACIÓN DE DATOS
La organización de los datos observados en tablas se va a realizar dependiendo del tipo de característica
en estudio.
Variables Nominales. Si la característica es de tipo cualitativo nominal, la tabla de distribución de
frecuencia es:
Llamamos frecuencia absoluta del valor x
i
al número de veces que aparece dicho valor en la muestra.
Se representa por n
i
con i = 1, 2, ..., r Nótese que el índice de n no varía como el de x, puesto que no
necesariamente tiene que haber tantos valores como observaciones (en este caso, r N es la cantidad
total de valores distintos que toma la variable).
Se verifica que la suma de todas las frecuencias es igual al número total de observaciones:

En el caso de las modalidades, no es posible establecer un orden para ellas, por lo que se suelen ordenar
según el criterio del investigador.
La frecuencia relativa del valor x
i
es la proporción de veces que aparece el valor i-ésimo de la variable
en proporción al total de observaciones. Se representa por f
i
:
Es inmediato observar que la suma de todas las frecuencias relativas es 1, pues supone la proporción
de todos los datos frente al total:


Visualiza gratis el PDF completo

Regístrate para acceder al documento completo y transformarlo con la IA.

Vista previa

BIOESTADÍSTICA

GRADO EN PODOLOGÍA

TEMA 1: ESTADÍSTICA DESCRIPTIVA

En la actividad clínica, tanto en la investigación como en la planificación, se aplican muchos elementos del razonamiento estadístico, aunque los investigadores no sean conscientes de ello. La Estadística como ciencia no se puede reducir a una serie de técnicas más o menos complicadas para el profesional sanitario, sino que ha de entenderse como una interpretación de la realidad. Para ello, el primer paso es la comprensión de cómo se convierte la información en un modelo matemático.

ESTUDIO DE UNA SOLA VARIABLE

Población, universo o colectivo: Entes (personas u objetos) que son portadores de las características objeto de estudio. Cada elemento de la población se denomina individuo. En relación a su tamaño puede ser finita o infinita.

Muestra: Subconjunto representativo de la población. Se utiliza cuando la población es muy numerosa, infinita o muy difícil de examinar, así como cuando la característica a estudiar es complicada o supone la desaparición del individuo. En el caso en que la muestra coincida con toda la población, se denomina Censo.

Caracteres: Propiedades, rasgos o cualidades que se pretenden estudiar de los elementos de la población. Pueden ser cuantitativos o cualitativos, dependiendo de si son o no susceptibles de ser cuantificados. Esto no significa que, en ocasiones, no se usen valores numéricos para identificar las categorías de una variable cualitativa (por ejemplo, asignar los valores 0-varón, 1-mujer). Este proceso de denomina codificación.

Cada uno de los resultados posibles de una variable cualitativa se denomina modalidad o valor. Cuando una información de tipo cualitativo es no numérica y sus valores no se pueden ordenar se le llama variable cualitativa nominal y, si se puede ordenar se denomina variable ordinal (por ejemplo, el grado de mejoría de un paciente: nulo/leve/moderado/total). Cuando una variable cualitativa sólo tiene dos valores posibles se le denomina dicotómica (si/ no, varón/ mujer, etcétera).

Según la cantidad o tipo de valores que pueden tomar, las variables cuantitativas son discretas (aquellas que no pueden tomar un valor intermedio entre dos consecutivos, como la edad, el número de pulsaciones, etc.) o continuas (las que pueden tomar un número infinito de valores de modo que entre dos cualesquiera puede haber siempre otro, como el nivel de colesterol en sangre, la temperatura, etcétera).

Tipos de datos, tabulación y representaciones gráficas

Julio Oliva Contero 1BIOESTADÍSTICA GRADO EN PODOLOGÍA u SEVI

TABULACIÓN DE DATOS

La organización de los datos observados en tablas se va a realizar dependiendo del tipo de característica en estudio.

Variables Nominales

Si la característica es de tipo cualitativo nominal, la tabla de distribución de frecuencia es:

Variable Frecuencias Frecuencia Porcentaje (pi) cualitativa absoluta (ni) relativa (fi) X1 nı fı Pı X2 n2 f2 P2 · . . · . . · . Xk nk fk Pk n 1 100

Llamamos frecuencia absoluta del valor xi al número de veces que aparece dicho valor en la muestra. Se representa por ni con i = 1, 2, ... , r Nótese que el índice de n no varía como el de x, puesto que no necesariamente tiene que haber tantos valores como observaciones (en este caso, r ≤ N es la cantidad total de valores distintos que toma la variable).

Se verifica que la suma de todas las frecuencias es igual al número total de observaciones:

n= > ni i=1 r

En el caso de las modalidades, no es posible establecer un orden para ellas, por lo que se suelen ordenar según el criterio del investigador.

La frecuencia relativa del valor xi es la proporción de veces que aparece el valor i-ésimo de la variable en proporción al total de observaciones. Se representa por fi:

ni fi = N

Es inmediato observar que la suma de todas las frecuencias relativas es 1, pues supone la proporción de todos los datos frente al total:

Ifi=1 i=1 r

Tipos de datos, tabulación y representaciones gráficas

Julio Oliva Contero 2BIOESTADÍSTICA GRADO EN PODOLOGÍA u VILL

Al valor pi se le denomina porcentaje del valor i. Se define como el producto de la frecuencia relativa por 100 Pi = 100fi

La suma de los porcentajes es igual a 100

r 2Pi = 100 i=1

Ejemplo: Sea X la variable "grupo sanguíneo". Se selecciona una muestra de 200 individuos con objeto de estudiar el grupo sanguíneo de los mismos. Los datos observados son los siguientes:

Grupo sanguíneo (X) Frecuencias absoluta (ni) Frecuencia relativa (fi) Porcentaje (pi) A 82 0,41 41 B 18 0,09 9 AB 8 0,04 4 O 92 0,46 46 n=200 1 100

Variables Ordinales

Si la característica es de tipo cualitativo ordinal o discreto, la tabla de distribución de frecuencia es:

Variable Frecuencias Frecuencia Porcentaje Frecuencia absoluta acumulada acumulada (%) (Ni) (Fi) X 1 n 1 fı Pı F P n2 f2 Pz N2 F2 P2 · . · . · . . · . . · X n fk Pk NK=n Fx=1 PK=100 n 1 100 Frecuencia relativa Porcentaje acumulado Cuantitativa absoluta (ni) relativa (fi) (pi) discreta (X)

Las columnas xi, ni, fi , pi, representan los valores, frecuencias absolutas, frecuencias relativas y porcentajes, respectivamente, análogos al caso de la variable cualitativa.

Los valores xi para una variable discreta son numéricos y se tabulan ordenados.

Tipos de datos, tabulación y representaciones gráficas

Julio Oliva Contero 3BIOESTADÍSTICA GRADO EN PODOLOGÍA u VILL

La frecuencia absoluta acumulada del i-ésimo valor de la variable X es la suma de todas las frecuencias absolutas de los valores menores o iguales a xi:

i Ni = >nj j=1

Es inmediato observar que NI = n1 y que Nr = n

La frecuencia relativa acumulada del i-ésimo valor de la variable X es la suma de todas las frecuencias relativas de los valores menores o iguales a xi:

i Fi = >f j=1

Es inmediato observar que F1 = fi y que Fr = 1

Análogamente, llamamos porcentaje acumulado de observaciones del i-ésimo valor de la variable X a la suma de todos los porcentajes de los valores menores o iguales a xi:

i Pi = >Pi j=1

Es inmediato observar que P1 = pi y que Pr = 100

Las frecuencias absolutas y relativas acumuladas, así como los porcentajes acumulados sólo se pueden calcular para variables que puedan ser ordenadas, por lo tanto, para variables ordinales y cuantitativas.

Ejemplo: sea X el "nº de hijos varones de familias con 2 hijos"

Nº de hijos Frecuencias Frecuencia Porcentaje Frecuencia Porcentaje acumulado varones (X) absoluta relativa (fi) (pi) Frecuencia absoluta acumulada relativa acumulada (%) (Ni) (Fi) 0 90 0,45 45 90 0,45 45 1 80 0,40 40 170 0,85 85 2 30 0,15 15 200 1 100 n=200 1 100 (ni)

Tipos de datos, tabulación y representaciones gráficas

Julio Oliva Contero 4BIOESTADÍSTICA GRADO EN PODOLOGÍA u

Variables Cuantitativas

En cuanto a las variables cuantitativas, si la muestra obtenida tiene demasiados valores (cuando la muestra es muy grande o los valores son continuos), es más operativo agrupar éstos en intervalos ya que en la práctica pueden obtenerse una gran cantidad de valores distintos entre sí que, al tabularlos, produciría una tabla con un gran número de valores con frecuencias 0 o 1.

Variable ni fi Pi N F Porcentaje Amplitud Marca de clase (Xi) Cuantitativa acumulado (ai) discreta (X) (%) Lo-L1 nı fı Pı NI F1 PI a x L1-L2 n2 f2 P2 N2 F2 P2 a2 X2 · . . . · · · · . . . · · · · · Lk-1-Lk nk fk Pk NK=n FK=1 PK=100 a Xk n 1 100

En caso de agrupación de valores, los intervalos se denominan intervalos de clase. El i-ésimo intervalo se nota por (Li-1, Li], considerándose el primer intervalo el [L0, L1] y coincidiendo el extremo superior de cada intervalo con el extremo inferior del intervalo siguiente.

La longitud de cada intervalo se denomina amplitud, y es la diferencia de los valores extremos, representándose por ai:

ai = Li - Li-1

En este caso, se toma un valor intermedio (normalmente la media aritmética, que es el punto medio) que represente a todo el intervalo. Dicho valor se denomina marca de clase. La agrupación de valores supone cierta pérdida de información, pero hace más manejables los datos.

Ejemplo: sea X la variable "altura"

Altura ni fi Pi Z F. Porcentaje Amplitu Marca de (X) acumulado d (ai) clase (x1) (%) 1,5-1,6 50 0,25 25 50 0,25 25 0,1 1,55 1,6-1,7 80 0,40 40 130 0,65 65 0,1 1,65 1,7-1,8 30 0,15 15 160 0,80 80 0,1 1,75 1,8-1,9 40 0,20 20 200 1 100 0,1 1,85 n=200 1 100

Tipos de datos, tabulación y representaciones gráficas

Julio Oliva Contero 5 . . . .BIOESTADÍSTICA GRADO EN PODOLOGÍA DE u SEVILLA

REPRESENTACIONES GRÁFICAS

Las representaciones gráficas constituyen una herramienta muy útil para la exposición de la información, ya que proporcionan al investigador una forma sencilla y rápida de acceder a los resultados.

El tipo de representación gráfica dependerá del tipo de información que tengamos disponible, es decir, según la variable sea cualitativa, cuantitativa discreta o continua.

Variables Cualitativas

En este caso, el principio de la representación es la proporcionalidad de las áreas a las frecuencias absolutas. Se pueden utilizar diagramas de sectores o diagramas de rectángulos.

Los diagramas de sectores consisten en dividir un círculo en tantos sectores circulares como modalidades presente la variable, asignando un ángulo central a cada sector proporcional a la frecuencia absoluta ni (o a la frecuencia relativa o al porcentaje), y por consiguiente un área proporcional a la frecuencia absoluta (o a la frecuencia relativa o al porcentaje).

Diagrama de sectores

grupo_sanguineo 0 10% A AB 5% B 45% 40%

Los diagramas de rectángulos son rectángulos construidos sobre cada carácter, con la misma base y de alturas proporcionales a la frecuencia absoluta del carácter en cuestión. Su superficie es proporcional a su porcentaje.

Diagrama de rectángulos

50 40 Porcentaje 30 20 10 0 0 A AB B Grupo sanguineo

Tipos de datos, tabulación y representaciones gráficas

Julio Oliva Contero 6BIOESTADÍSTICA GRADO EN PODOLOGÍA u VILL

El diagrama de barras se utiliza como representación gráfica cuando la variable es cuantitativa discreta. Se obtiene representando unos ejes de coordenadas, en el eje horizontal se señalan los distintos valores de la variable cuantitativa discreta, y en el de ordenadas los porcentajes de cada valor. A partir de aquí se trazan barras, perpendiculares al eje horizontal en cada valor de la variable estadística discreta y de altura el porcentaje de dicho valor. También puede utilizarse la frecuencia absoluta o relativa en el eje de ordenadas.

Diagrama de barras

50 40 Porcentaje 30 20 10 0 2 4 6 8 10 numero de convivientes en la familia

En el caso de las variables cuantitativas continuas, se utilizan dos clases de representaciones gráficas: el histograma y el polígono de frecuencias.

El histograma se construye sobre unos ejes de coordenadas, levantando sobre cada intervalo un rectángulo cuyo área es proporcional a la frecuencia del correspondiente intervalo. Se señalan en el eje horizontal los distintos extremos de los intervalos de clase, y en el eje vertical los porcentajes de cada intervalo. A partir de esto se construyen rectángulos contiguos, cuyas bases son las amplitudes de los intervalos y cuya altura es el porcentaje de cada intervalo del intervalo.

Histograma

20 15 Porcentaje 10 5 0 20 30 40 50 60 70 edad

Tipos de datos, tabulación y representaciones gráficas

Julio Oliva Contero 7

¿Non has encontrado lo que buscabas?

Explora otros temas en la Algor library o crea directamente tus materiales con la IA.