Muestra aleatoria simple
Dada una variable aleatoria X, una muestra aleatoria simple, es un conjunto de variables aleatorias, independientes e idénticamente distribuidas, obtenidas a partir de la variable aleatoria X y que se distribuyen igual que la misma.
Formalmente la definición anterior es la que define a una muestra aleatoria simple. Ahora bien, en realidad, el concepto se puede definir de forma más sencilla. Claro que, para entender adecuadamente el concepto de muestra aleatoria simple es importante definirlo de forma precisa.
Dado que la definición formal es compleja, vamos a desgranar poco a poco cada una de las partes de la definición.
El concepto de muestra aleatoria simple paso a paso
Así, en primer lugar, hemos de tener en cuenta que una muestra aleatoria simple es una muestra. Como muestra, se obtiene a partir de una variable aleatoria. A dicha variable aleatoria, la hemos llamado X. Un ejemplo de variable aleatoria podría ser la nota en matemáticas de los alumnos de un instituto. Por tanto, la primera parte de la definición está clara. Una muestra aleatoria simple es una muestra obtenida a partir de una variable aleatoria cualquiera.
La segunda parte de la definición es más compleja. Sobre todo, por los conceptos de “aleatorias independientes e idénticamente distribuidas”. El concepto de aleatorio significa azar. Como la muestra se ha obtenido de forma azarosa, las variables, consecuentemente, son aleatorias. El concepto de independiente hace referencia a que los datos obtenidos no guardan relación entre sí. Es decir, escoger un determinado dato no depende de los datos escogidos anteriormente o que serán escogidos posteriormente. Por último, idénticamente distribuidas se refiere a que la distribución estadística es la misma.
Resumiendo, tenemos que una muestra aleatoria simple es una muestra que se ha obtenido de forma totalmente azarosa. De manera que los datos que conforman la muestra no guardan relación entre sí y heredan las características de la variable aleatoria poblacional X.
¿Por qué es tan importante el concepto de muestra aleatoria simple?
Cuando queremos realizar una investigación sobre ciertas características de un conjunto de datos, la calidad de la muestra es esencial. Para que las métricas calculadas y, por tanto, las conclusiones de la investigación sean fiables, debemos tener lo que se conoce como una muestra representativa. Esto es, una muestra que represente adecuadamente las características de la población total.
Una de las principales características de una muestra representativa es que sea aleatoria. Por tanto, conocer el concepto de muestra aleatoria simple es de vital importancia para que nuestro estudio tenga validez en la comunidad científica.
Ejemplo de muestra aleatoria simple
Supongamos que queremos realizar un estudio sobre los salarios mensuales de los ciudadanos de un país. Nuestra variable aleatoria será el salario mensual de los ciudadanos.
El concepto de muestra surge debido a la imposibilidad de preguntar a todos y cada uno de los ciudadanos de un país. Eso llevaría mucho tiempo o muchos recursos económicos. Así, en lugar de preguntar a 50 millones de personas, decidimos preguntar a 50.000.
Una vez hemos definido la variable sobre la que vamos a trabajar y la población de datos, toca proceder a obtener la muestra. Sobre la obtención correcta de una muestra existe una extensa literatura. Pero, dado que el objetivo de esta definición es acercar este concepto de forma sencilla, no nos adentraremos en la materia.
Simplificando mucho, generalmente, tendremos dos opciones. O preguntar a ciudadanos de forma totalmente aleatoria o elegir un proceso de selección. Para que la muestra cumpla el criterio de “aleatoria” debemos hacerlo totalmente al azar. No podemos elegir ciudades, ni zonas, ni barrios, ni nada.
Si elegimos el proceso de selección de forma consciente, entonces nuestra muestra probablemente será sesgada. Lo correcto sería utilizar una herramienta que extraiga nombres de ciudadanos al azar.
Una vez tenemos nuestra muestra aleatoria simple, entonces toca trabajar con los datos. Es decir, realizar inferencia estadística. Esta inferencia estadística nos permitirá extraer conclusiones del estudio. Por ejemplo, afirmaciones del tipo: «el salario medio mensual en España es de 1.200 euros» o, «solo el 5% de los ciudadanos con sueldos más altos cobran el equivalente al 30% más pobre».
Todo ello con un margen de error claro está. Pero de eso, ya se encarga la inferencia estadística.