Pasos para calcular el tamaño de muestra

  • por

Al realizar un estudio de mercado para iniciar un negocio, muchas veces utilizamos la técnica de la encuesta para obtener datos de los clientes potenciales, y para ello se hace necesario calcular el tamaño de muestra, es decir, la cantidad de personas de la población a quienes vamos a consultar. A continuación, te explicaré cómo calcularlo, siguiendo pasos sencillos.

Conceptos básicos de población y muestra

Definición de población

Una población es el conjunto de personas que tienen características comunes y acerca de los cuales intentamos obtener conclusiones. Por ejemplo, aquellas personas del distrito de san Borja en Lima Perú cuyas características similares son que tienen entre 18 y 35 años de edad, son hombres y mujeres y pertenecen a los niveles socio-económicos B y C.

El tamaño de la población es la cantidad total de personas que comprende el segmento de emrcado que se estudiará.

En nuestro caso el tamaño de la población es de 32,084 personas.

Existen dos tipos de población: finita e infinita.

La población finita es el conjunto de elementos que pueden contabilizarse y conocer su tamaño.

La población infinita es el conjunto de elementos que no pueden contabilizarse. Cuando la población es mayor que 10,000, para efectos estadísticos, se puede considerar una población infinita.

Definición de muestra y tamaño de muestra

Una muestra es un subconjunto o una parte de la población, que se obtiene para averiguar las propiedades o características de esta última. Por ello es importante que sea representativa de la población.

Por consiguiente, para nuestro caso, es la cantidad de personas a las cuales se aplicarán los cuestionarios de encuesta.

¿Cuándo se necesita una muestra?

En muchos casos, el tamaño de la población es demasiado grande que sería imposible analizar a cada persona individualmente, y por ello se trabaja con una muestra. Para nuestro caso ejemplo, imagina si tendríamos que aplicar encuestas a las 32,084 personas. Sería casi imposible o si se realizara el costo sería demasiado elevado y se necesitarían muchísimas horas hombre, y no sería conveniente financieramente. Por ello es que necesitamos trabajar con una muestra y debemos hacer el cálculo del tamaño de muestra.

Es necesario tener presente que un tamaño de muestra demasiado grande representa un desperdicio de recursos, tanto materiales como humanos. También, un tamaño demasiado pequeño es un desperdicio de esfuerzo, pues los resultados que se obtengan del estudio no tendrán un efecto significativo o se tendrán menos probabilidades de hacerlo.

¿De qué depende el tamaño de muestra?

Para calcular el tamaño de muestra se deben considerar las decisiones estadísticas y no estadísticas que tome el investigador.

Decisiones estadísticas

El tamaño de muestra dependerá del grado de precisión y confiabilidad que queremos tener en los resultados. Por esta razón, a mayor grado de confiabilidad y precisión, mayor será el tamaño de muestra.

 Decisiones no estadísticas

En este caso se puede considerar la disponibilidad de los recursos, el presupuesto o el equipo de personas que hará el trabajo de campo. Si los recursos son limitados, o el equipo de encuestadores no es óptimo, probablemente el tamaño de muestra sea menor al deseado. Ten presente que un encuestador capacitado tiene un costo más elevado que aquel que no tiene suficiente preparación y experiencia.

Factores estadísticos que influyen el cálculo del tamaño de muestra

Los factores que intervienen al calcular el tamaño de muestra son los siguientes:

El error máximo admisible (d)

Es el que determina la precisión de los resultados. Es la máxima diferencia que podemos tolerar entre el valor de la variable obtenido en la muestra y el verdadero valor de ésta en la población. Para establecer el valor del error máximo admisible debemos preguntarnos cuán precisos deseamos que sean los resultados de la investigación.

Por ejemplo, para nuestra tienda de regalos, la investigación tiene por objetivo conocer el ticket promedio de compra en una tienda de regalos, y considera un error máximo admisible del 5%. Si en el estudio se obtiene que el ticket promedio es de S/. 100 por persona, estaríamos aceptando que realmente el verdadero valor esté entre 100 ± 5, es decir entre S/. 100 + 5% y S/. 100 – 5%, lo que da un intervalo de entre S/. 95 y S/. 105.

El error máximo admisible está relacionado inversamente con el tamaño de la muestra. A mayor error, el tamaño de muestra será más pequeño, y a menor error el tamaño de muestra será más grande.

Las empresas encuestadoras de renombre en el Perú utilizan un margen de error del 5%. Sin embargo, si se utilizara un margen de error del 10%, en muchos casos, los resultados también podrían ser significativos.

Coeficiente de confianza de la estimación (Z)

Para hacer la afirmación anterior sobre los límites dentro de los cuales se encuentra el verdadero valor poblacional, debe conocerse la probabilidad de que estos resultados sean ciertos y esto lo da el coeficiente o nivel de confianza, el cual es la medida probabilística de que el intervalo fijado con el error máximo admisible, contenga el valor poblacional.

En el ejemplo anterior, del ticket promedio de compra de regalos, se decidió trabajar con un nivel de confianza de 90%, con lo cual podríamos afirmar con un 90% de certeza que el ticket promedio de compra está entre S/. 95 y S/. 105. Claro está, queda 10% de posibilidades de equivocarnos al establecer esa conclusión. Si trabajamos con 95% de confianza, nos quedaría una posibilidad de equivocarnos de 5%.

A mayor nivel de confianza, más elevado será el tamaño de muestra, y al contrario, a menor nivel de confianza, el tamaño de muestra también será menor.

En general, los niveles de confianza más usuales son: 90%; 95% y 99%. En Perú las grandes empresas encuestadoras trabajan con un nivel de confianza del 95% y muchos investigadores trabajan con 90% de confianza.

Es necesario señalar que el nivel de confianza da lugar a un coeficiente denominado coeficiente Z, el mismo que es utilizado en las fórmulas para calcular el tamaño de muestra. Cada nivel de confianza es representado por el valor correspondiente del coeficiente Z, tal como sigue:

Varianza de la población (p.q)

Recordemos el significado de los símbolos:

= Es la probabilidad de éxito o proporción esperada. (Las personas responden Si.)

q = Es la probabilidad de fracaso o proporción de repuestas en la otra categoría. (Las personas responden No.).

La varianza en los ítems dicotómicos (dos respuestas que se excluyen mutuamente) es igual a pq y la varianza mayor (la mayor diversidad de respuestas) se da cuando p = q = 0.50 (la mitad de las personas responde sí y la otra mitad responde no).

Como se desconoce la varianza de la población, ponemos la varianza mayor posible porque a mayor varianza hará falta una muestra mayor. Es decir, consideramos los valores de p=q=0.50.

Pasos para calcular el tamaño de muestra

Para que la explicación sea práctica, utilizaré un caso ejemplo. Se trata de realizar un estudio de mercado para iniciar un negocio de regalos dirigido a personas entre 18 y 35 años de edad, hombres y mujeres, del nivel socio-económico B y C del distrito de San Borja en Lima, Perú. De acuerdo a las estadísticas, la población entre 18 y 35 años de edad perteneciente a los niveles socio-económicos B y C es de 32,084 personas.

Para obtener los datos se debe realizar una encuesta y aplicar un cuestionario a un determinado número de personas que tengan dichas características, y para ello es necesario calcular el tamaño de muestra a considerar en el estudio.

Paso 1. Definir tipo de población y fórmula

En primer lugar, dependiendo de la población, si es finita o infinita, se utilizará la fórmula correspondiente, tal como sigue:

Fórmula para población finita

En donde:

n: Tamaño de muestra que queremos calcular

N: Tamaño de la población

Z: Coeficiente de confianza para un nivel de confianza determinado

p: Probabilidad de éxito

q: Probabilidad de fracaso. d: Error máximo admisible

Para población infinita

La fórmula para calcular el tamaño de muestra cuando el tamaño de la población se desconoce o es infinita, es la siguiente:

En donde:

Z: Coeficiente de confianza para un nivel de confianza determinado

p: Probabilidad de éxito

q: Probabilidad de fracaso.

d: Error máximo admisible

Paso 2: Definir los valores de las variables a utilizar

Para el caso del ejemplo aplicativo, la población es finita, por lo tanto, utilizaremos la primera fórmula. Las variables cuantificadas son las siguientes:

N: Tamaño de la población. 32,084 personas.

Z: Coeficiente de confianza. Z = 1.645 para un nivel de confianza del 90%

p: Probabilidad de éxito. Consideramos el máximo: 0.50

q: Probabilidad de fracaso. Será 1.00 – 0.50 = 0.50

d: Error máximo admisible. Consideramos el 5%

Paso 3: Aplicar la fórmula para calcular el tamaño de muestra

Aplicamos la fórmula de tamaño de muestra para poblaciones finitas y obtenemos:

n = 268

Como resultado, el cálculo del tamaño de muestra nos da 268 personas; por lo tanto, que corresponde a la cantidad de encuestas que realizaremos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *