Variable categórica
Una variable categórica es aquella que permite clasificar una serie de datos por medio de valores fijos asociados a una cualidad o categoría concreta.
La variable categórica, a diferencia de las variables cardinales o continuas (que permiten cálculos numéricos), clasifica a los individuos o casos. Normalmente toman valores representados por números enteros, como el uno o el cero, pero estos son solo eso, representaciones.
En el ejemplo lo veremos con más detalle.
Diferencias entre variable categórica y continua
Existen algunas diferencias entre la variable categórica y la continua o cardinal que conviene conocer. Veamos las más relevantes.
- En primer lugar, la variable categórica sirve para agrupar y la continua para contar. Es decir, la primera permite formar categorías con una serie de datos. Por ejemplo, el género o el número de hijos. La segunda nos aporta información numérica. Por ejemplo, la edad.
- La variable cardinal permite realizar cálculos numéricos, las otras no. De esta forma, en las primeras podemos conocer las medias o las varianzas, mientras que en las otras solo algunos datos, como la moda o los porcentajes de categorías.
- Las categóricas son muy útiles para conocer información de tipo cualitativo, es decir, alguna cualidad de los datos. Las continuas nos aportan datos cuantitativos, es decir, cantidades y valores representados por números.
Técnicas estadísticas para variables categóricas
A continuación, veamos las técnicas estadísticas más utilizadas en las variables categóricas, comparándolas con las de las continuas o cardinales.
- Estadística descriptiva: En este tipo de variables, los análisis suelen basarse en diagramas de barras y porcentajes, entre otros. Las cardinales permiten aplicar técnicas de análisis para calcular estadísticos de posición como los cuantiles, o de dispersión como las varianzas.
- Contraste de hipótesis: En las categóricas, los resultados se pueden extrapolar por medio de los contrastes de hipótesis no paramétricos. Por su parte, las continuas utilizan contrastes paramétricos que también se pueden inferir.
- Técnicas de regresión: En este caso, para las primeras se utiliza, entre otras, la regresión logística o similares. Para el otro tipo de variables, la técnica más utilizada es la regresión lineal.
Ejemplo de variable categórica
Para terminar, veamos un ejemplo muy frecuente en el marketing. Imaginemos que queremos vender un producto y nos interesa conocer el estado civil.
Para ello, asignaremos 1 a soltero, 2 a casado, 3 a divorciado, 4 a en pareja y 5 a otros.
Veamos la imagen y después la comentamos:
En ella, podemos observar que el mayor porcentaje de individuos son solteros, casados y divorciados, siendo las otras dos opciones de solo el 5%.
Como vemos, las variables categóricas son útiles para agrupar. El diagrama de barras nos permite observar mejor dichos porcentajes, ya que es más sencillo comparar el tamaño de las barras.