Describir un fenómeno político con dos variables categóricas

Documento de Universidad sobre describir un fenómeno político con dos variables categóricas. El Pdf explica conceptos estadísticos como proporciones conjuntas, condicionales y marginales, coocurrencia y asociación entre variables, útiles para Matemáticas a nivel universitario.

19 páginas

1. ¿Qué queremos hacer?

En una investigación social, podemos tener tres objetivos:

1. Explicar → Por ejemplo: ¿El comedor escolar reduce el absentismo?

2. Describir → Por ejemplo: ¿Qué porcentaje de personas apoya las supermanzanas en Barcelona?

3. Predecir → Por ejemplo: ¿Qué candidato tiene más posibilidades de ganar?

2. Describir una variable... o dos a la vez

A veces estudiamos solo una cosa (una variable), por ejemplo: “¿Dónde vive la gente?”.

Pero otras veces queremos estudiar dos cosas al mismo tiempo, por ejemplo: ¿Hay más personas mayores en

pueblos rurales que en las ciudades?

Ahí es donde hablamos de dos variables categóricas.

3. ¿Qué son las variables categóricas?

Son características que se dividen en categorías (no en números):

• Sexo: hombre / mujer

• Tipo de municipio: rural / urbano / capital

• Edad: joven / adulto / anciano

• ¿Es directivo?: sí / no

No se suman ni se restan, solo se clasifican.

4. Las proporciones

Una proporción es como una fracción o un porcentaje.

Ejemplo: Si 12 personas de 200 han hecho una gran donación → 12/200 = 0,06 = 6 %

Pero siempre hay que preguntarse: ¿6 % de qué? ¿del total de las personas? ¿del grupo de directivos? ¿de los

mayores?

5. Proporción conjunta

Nos dice cuántas personas tienen dos características al mismo tiempo.

Ejemplo: ¿Qué proporción de personas son mayores y viven en un pueblo rural?

Lo vemos con tablas de doble entrada, con filas y columnas.

•

𝜋𝑋

𝑥

𝑌

𝑦

6. Proporción condicional

Nos dice cuántas personas de un grupo concreto tienen cierta característica (dado que…).

Ejemplo: De todos los directivos, ¿cuántos hicieron una gran donación?

Aquí no miramos a toda la población, solo a un grupo especifico.

•

𝜋𝑋

𝑥

𝑌

𝑦

7. Proporción marginal

Es la más sencilla: la proporción total de personas que tienen una sola característica, sin importar las demás.

Ejemplo: ¿Qué proporción total ha hecho una gran donación?

•

𝜋𝑋

𝑥

8. Tablas con dos variables (doble entrada)

Imaginemos una tabla donde:

• En las columnas está la edad: Joven, Adulto, Anciano.

• En las filas está el tipo de residencia: Rural, Urbano, Capital.

Así podemos ver los cruces entre variables, como cuántos adultos viven en zonas urbanas.

9. ¿Qué es la coocurrencia?

Coocurrencia significa que dos cosas ocurren juntas.

Ejemplo: ¿Cuántas veces una persona es directiva y además hace una gran donación?

Si pasa muchas veces, tal vez hay una relación entre ser directivo y donar mucho.

10. ¿Qué significa que dos variables están asociadas?

Dos variables están asociadas si conocer una nos ayuda a adivinar la otra.

Ejemplo: Si la mayoría de grandes donantes son directivos; saber que alguien es directivo me da una pista sobre

si ha donado mucho à hay asociación.

En cambio, si da igual ser directivo o no para donar mucho à no hay asociación.

• Dos categorías están asociadas solo si:

𝜋𝑥

𝑦

1 ≠

𝜋𝑋

𝑥

𝜋𝑌

𝑦

• Dos variables binarias están asociadas solo si:

𝜋𝑋

𝑌

≠

𝜋𝑋𝜋𝑌

11. ¿Cómo se mide la asociación?

Método 1: Chi-cuadrado (

𝜒

²) de Pearson

• Trata de medir cuanta asociación existe entre dos variables.

• Mide cuanta distancia hay entre lo que observamos con lo que esperábamos si no hubiese relación.

o Frecuencia absoluta observada:

𝑁𝑐

𝑁

∗

𝜋𝑥

𝑦

𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎

Vista previa

Objetivos de Investigación Social

¿ Qué queremos hacer? En una investigación social, podemos tener tres objetivos:

Explicar -> Por ejemplo: ¿ El comedor escolar reduce el absentismo?
Describir -> Por ejemplo: ¿ Qué porcentaje de personas apoya las supermanzanas en Barcelona?
Predecir -> Por ejemplo: ¿ Qué candidato tiene más posibilidades de ganar?

Descripción de Variables

Describir una variable ... o dos a la vez A veces estudiamos solo una cosa (una variable), por ejemplo: "¿Dónde vive la gente?". Pero otras veces queremos estudiar dos cosas al mismo tiempo, por ejemplo: ¿ Hay más personas mayores en pueblos rurales que en las ciudades? Ahí es donde hablamos de dos variables categóricas.
¿ Qué son las variables categóricas? Son características que se dividen en categorías (no en números): · Sexo: hombre / mujer · Tipo de municipio: rural / urbano / capital · Edad: joven / adulto / anciano · ¿ Es directivo ?: sí / no No se suman ni se restan, solo se clasifican.

Proporciones en Análisis de Datos

Las proporciones Una proporción es como una fracción o un porcentaje. Ejemplo: Si 12 personas de 200 han hecho una gran donación -> 12/200 = 0,06 = 6 % Pero siempre hay que preguntarse: ¿ 6 % de qué? ¿ del total de las personas? ¿ del grupo de directivos? ¿ de los mayores?
Proporción conjunta Nos dice cuántas personas tienen dos características al mismo tiempo. Ejemplo: ¿ Qué proporción de personas son mayores y viven en un pueblo rural? Lo vemos con tablas de doble entrada, con filas y columnas. . TTX=x,Y=y
Proporción condicional Nos dice cuántas personas de un grupo concreto tienen cierta característica (dado que ... ). Ejemplo: De todos los directivos, ¿cuántos hicieron una gran donación? Aquí no miramos a toda la población, solo a un grupo especifico. . TX=x|Y=y
Proporción marginal Es la más sencilla: la proporción total de personas que tienen una sola característica, sin importar las demás. Ejemplo: ¿ Qué proporción total ha hecho una gran donación? • πX=x

Tablas y Coocurrencia

Tablas con dos variables (doble entrada) Imaginemos una tabla donde: · En las columnas está la edad: Joven, Adulto, Anciano. · En las filas está el tipo de residencia: Rural, Urbano, Capital. Así podemos ver los cruces entre variables, como cuantos adultos viven en zonas urbanas.
¿ Qué es la coocurrencia? Coocurrencia significa que dos cosas ocurren juntas. Ejemplo: ¿ Cuántas veces una persona es directiva y además hace una gran donación? Si pasa muchas veces, tal vez hay una relación entre ser directivo y donar mucho.

Asociación entre Variables

¿ Qué significa que dos variables están asociadas? Dos variables están asociadas si conocer una nos ayuda a adivinar la otra. Ejemplo: Si la mayoría de grandes donantes son directivos; saber que alguien es directivo me da una pista sobre si ha donado mucho > hay asociación. En cambio, si da igual ser directivo o no para donar mucho > no hay asociación. . Dos categorías están asociadas solo si: TTx1,y1 # TX=x1 TY=y1 · Dos variables binarias están asociadas solo si: TTX,Y # TXTY
¿ Cómo se mide la asociación? Metodo 1: Chi-cuadrado (x2) de Pearson · Trata de medir cuanta asociación existe entre dos variables. · Mide cuanta distancia hay entre lo que observamos con lo que esperábamos si no hubiese relación. o Frecuencia absoluta observada: Nc = N * Tx,y observadao Frecuencia absoluta esperada si no hubiera asociación: Ec = N * Tx,y esperada si no hay asociación = N * TX * TY · Cuanto más diferente es lo observado de lo esperado, mayor asociación hay. · Parámetro de asociación poblacional de Pearson: XX,Y = 2 C (Nc-Ec)2 Ec Método 2: V de Cramer · Trata de hacer más interpretable el parámetro de asociación poblacional de Pearson. · Usa el resultado de Pearson, pero lo ajusta al tamaño de la población y al número de categorías. · El valor final está entre 0 y 1. Cuanto más cerca de 1, más fuerte la asociación. · Parámetro de asociación poblacional de Cramer: Vx,Y = XẢY N * min(categoríasx - 1, categoríasy - 1)
¿ Y si no tengo todos los datos? Normalmente no podemos preguntar a todo el mundo. Así que usamos una muestra, una parte de la población. Con esa muestra hacemos estimaciones de: · Proporciones conjuntas, condicionales y marginales. · Y también de los valores de Pearson y Cramer. o Estimador muestral de la asociación Pearson: xxx= > C (nc - Êc)2 Ê. o Estimador muestral de la asociación de Cramer: Vx,Y = n * min(categoríasx - 1, categoríasy - 1) Así, aunque no tengamos a todos, podemos sacar buenas conclusiones.
El camino completo del análisis
1. Recoger datos: encuestas, entrevistas, etc.
2. Analizar los datos: calcular proporciones y relaciones.
3. Sacar conclusiones: ¿ las dos características aparecen juntas? ¿ Están relacionadas?

Resumen de Proporciones y Asociación

Tipos de Proporción

Tipo de proporción	¿Qué nos dice?
Marginal	¿Qué parte total tiene una sola característica?
Conjunta	¿Qué parte total tiene dos cosas al mismo tiempo?
Condicional	¿Qué parte de un grupo tiene una determinada característica?

Tipos de Asociación

Método	¿Para qué sirve?
Pearson (x2)	Mide cuánta diferencia hay entre lo observado y lo que habría si no hubiera relación
Cramer (V)	Lo mismo, pero ajustado para que sea más fácil de interpretar (valor entre 0 y 1)

Fenómeno Político con Variables Numéricas

Objetivo del Estudio

Queremos estudiar cómo dos cosas que se miden con números (dos variables numéricas) están relacionadas. Por ejemplo: · La nota en matemáticas y la nota en lengua. · La edad y los días que alguien ha trabajado. · El número de libros en casa y la comprensión lectora.

Ejemplo del Departamento de Educación

El Departamento quiere saber si: · Invertir en tutorías con los padres (pocas familias, pero muy intenso) · Dar clases de refuerzo en lengua y mates (más familias, pero menos personalizado). La decisión depende de si los que van mal en lengua tambien van mal en mates. . Si los niños con malas notas en lengua y mates son los mismos -> mejor tutorías. · Si no lo son -> mejor refuerzo por separado. Para saberlo, se estudia la correlación entre las notas de lengua y mates.

Coocurrencia en Variables Numéricas

¿Qué es una coocurrencia? Es cuando dos cosas ocurren al mismo tiempo. Cuando trabajamos con categorías (como sí/no, joven/anciano), podemos encontrar combinaciones (cruces). Con variables numéricas, hay tantas combinaciones posibles, que usamos formas más prácticas de ver si una cosa cambia cuando la otra cambia (no tiene sentido hacer una tabla gigante).

Visualización con Nube de Puntos

¿Cómo lo miramos? Con una nube de puntos Dibujamos un gráfico con dos ejes: · Eje X: una variable (ej. nota en lengua) · Eje Y: otra variable (ej. nota en mates) Cada persona es un punto en ese gráfico. · Si los puntos suben juntos -> relación positiva. · Si bajan juntos -> relación negativa. · Si están desordenados -> no hay relación.

Medición de la Relación entre Variables

Covarianza poblacional: · Es una fórmula que nos ayuda a saber si dos cosas cambian/se mueven juntas. o Positiva: suben juntas. o Negativa: una sube y la otra baja. · Se suman todas las diferencias entre el valor y la media de cada variable, y se multiplica. Después se hace una media de todo eso. · Fórmula: COVX,Y = Σί(χι-μχ) (Vi-μγ) N Para cada individuo, el sigo es la dirección de la asociación; y la fuerza es el grado de la asociación. Solo recoge la asociación lineal. ** Problema: la covarianza da un numero difícil de interpretar, poque depende de las unidades (euros, puntos, etc.).
Correlación poblacional de Pearson: · Es como la covarianza (mejorada), pero dividida por las desviaciones típicas de cada variable. Así se normaliza el resultado y se vuelve fácil de entender. · Siempre da un valor entre -1 y +1. o +1 -> relación perfecta positiva (dirección: + = directa). Fuerza: exactamente 1 = plena asociación. o 0 -> sin relación (fuerza: exactamente 0 = nula asociación). o -1 -> relación perfecta negativa (dirección: - = inversa). · Es como un termómetro de como de fuerte es la relación entre dos cosas: si es cercano a 1 o -1, la relación es fuerte; si es cercano a 0, no hay relación. · Fórmula: Corrx,Y =~ Σ: OX (χi-μχ) * (Vi-μγ) σγ
Correlación poblacional de Spearman: · A veces, aunque no siga una línea recta, hay relación. Esto es una relación monótona: siempre sube o siempre baja, pero no en línea recta. · En vez de mirar los valores exactos (números), miramos los rangos (posición en una lista de datos reordenados de menor a mayor): R(X) y R(Y).· Luego vemos si los rangos de una variable se parecen a los de la otra. Es como una "correlación de posiciones": mide si los rangos se parecen. Es como lo que hace Pearson, pero con rangos. · Fórmula: Spearmanx,y = N Li (R(xi)-HR(X)) ØR(X) * (R(Vi)-PR(Y)) ØR(Y)

Proceso con los Datos

¿Qué hacemos con los datos?

Tomamos una muestra aleatoria (por ejemplo, 300 personas de Girona).
Calculamos la media de cada variable.
Creamos una nube de puntos con esos datos.
Calculamos covarianza y correlaciones (Pearson y Spearman).
Interpretamos: ¿ hay relación? ¿ qué tipo es? ¿ es fuerte?

Resumen de Conceptos

Concepto	¿Qué hace?
Nube de puntos	Dibuja los datos y muestra visualmente si hay relación
Covarianza	Mide si dos cosas suben o bajan juntas
Pearson	Dice cuán fuerte es la relación lineal entre dos cosas
Spearman	Dice cuán fuerte es la relación entre rangos (orden)

Ejercicio de Descripción con Dos Variables

El Problema de Investigación

Tema Describir un fenómeno social con dos variables. Imagina que trabajas en un ministerio importante del gobierno de España y necesitas decidir en qué países invertir para mejorar cosas como la convivencia, la educación o la paz.

El problema Primero debemos entender qué queremos investigar. Supongamos que estás en el Ministerio de Cohesión Social. · Tu misión es fomentar la paz y la convivencia: o Que la gente viva bien junta (sin peleas, con respeto). o Que haya paz entre grupos diferentes. o Que la gente participe en la vida política de su país. Las principales preguntas que nos hacemos son: · ¿ Qué problemas suelen ir juntos en los países? · ¿ Qué fenómenos están conectados entre sí? Así vemos que, si un país tiene poco derecho de asociación y mucho conflicto, sabremos que estas dos cosas están relacionadas.

Plan de Investigación

El plan Ahora hacemos el plan de investigación: · ¿ Quién nos interesa? Los países del mundo. · ¿ Cuándo los analizamos? Enero de 2025. · ¿ Qué queremos saber? Si dos variables sociales están relacionadas. Tipos de variables:
1. Categóricas (como: derechos de asociación/nivel de conflicto) -> Chi-cuadrado (x2) y V de Cramer, para ver si están asociadas.
2. Numéricas (como: índice de globalización social/participación política) -> Correlación de Pearson y de Spearman, si los datos son lineales.

Recogida de Datos

Recogida de datos Buscamos los datos para nuestro estudio: · Usamos información de 193 países (miembros de la ONU). · Fuente: Instituto de Calidad de Gobierno (Universidad de Gotemburgo, Suecia).

¿Non has encontrado lo que buscabas?

Explora otros temas en la Algor library o crea directamente tus materiales con la IA.

Describir un fenómeno político con dos variables categóricas

Generar con IA

Vista previa

Objetivos de Investigación Social

Descripción de Variables

Proporciones en Análisis de Datos

Tablas y Coocurrencia

Asociación entre Variables

Resumen de Proporciones y Asociación

Tipos de Proporción

Tipos de Asociación

Fenómeno Político con Variables Numéricas

Objetivo del Estudio

Ejemplo del Departamento de Educación

Coocurrencia en Variables Numéricas

Visualización con Nube de Puntos

Medición de la Relación entre Variables

Proceso con los Datos

Resumen de Conceptos

Ejercicio de Descripción con Dos Variables

El Problema de Investigación

Plan de Investigación

Recogida de Datos

Contenidos relacionados