Muestreo Aleatorio Simple

Estimación de proporciones

Por:

Dr. Luis Antonio Pérez González

Instituto Tecnológico de Orizaba - ipac

lperez@ipac.com.mx

 

Contenido

 

Resultados básicos. 2

Selección del tamaño de la muestra. 4

Consideraciones prácticas para la determinación del tamaño de la muestra. 5


Sea A una población cuyas unidades presentan sólo una característica de tipo binario, entendiendo por esto que a la unidad h-ésima de A le corresponde un solo valor ah e {0,1}, h=1, ..., N. Las características de tipo binario se presentan en muchísimas situaciones prácticas: se tiene o no un bien determinado; se vota o no por un partido político determinado; un producto es bueno o defectuoso; una empresa ahorra o no energía; una empresa mantiene o abandonó un conjunto de medidas que implementó para ahorrar energía;  etc.

Observación. Al desarrollar los conceptos relativos a la estimación de una media, no impusimos a ah el que tomaran algún conjunto específico de valores. Por otra parte, al estimar proporciones estamos exigiendo ah e {0,1}. Luego, la estimación de proporciones es una particularización del caso antes estudiado y, por consiguiente, todas las afirmaciones que hicimos para determinar el tamaño de la muestrea al estimar las medias, aplican al presente caso. Por lo tanto podemos aplicar directamente la expresión (MAS14) para estimar el tamaño de la muestra en el caso que ahora nos ocupa. Sin embargo, antes de proceder a esto destacaremos algunas consecuencias de la particularización que estamos abordando para sacar provecho de ella.

Sea X1, X2, …, Xn, n < N, una muestra aleatoria simple sin reemplazo extraída de A. Consideremos las notaciones siguientes:

(MAS15)         

(MAS16)         

En las anteriores notaciones p y s2 representan la media y las varianzas poblacionales, respectivamente, mientras que  y s2 representan a la media y varianza muestrales.

Resultados básicos

Teorema (MAS6). El parámetro p representa la proporción de unidades en la población a las que les corresponde el valor 1.

Demostración. En efecto,   es igual al número de unos en la población, y al dividir sobre N esta sumatoria, obtenemos a la proporción de unos en la misma población.

Teorema (MAS7). s2 = p(1-p)

Demostración.

                           

Los siguientes teoremas (teoremas MAS8 al MAS11), no serán demostrados, ya que, como hemos afirmado líneas arriba, son casos particulares de los teoremas MAS1 al MAS5 que enunciamos al hablar del muestreo aleatorio simple para la estimación de medias.

Teorema MAS8. Sea X1, X2, …, Xn, n < N, una muestra aleatoria simple sin reemplazo extraída de la población finita binaria A. Sea p la proporción de unidades en la población a las que les corresponde el valor 1. Entonces:

(MAS17)         

Corolario. Si X1, X2, …, Xn, n < N, es una muestra aleatoria simple sin reemplazo extraída de la población finita binaria A, entonces

                         

Teorema MAS9.  es un estimador insesgado (no desplazado) de la media poblacional p, es decir:

(MAS18)           

Teorema MAS10.

(MAS19)         

Corolario: Si

(MAS20)         

entonces

(MAS21)         

Teorema MAS11. Se cumplen las siguientes tres propiedades:

(MAS22)         

Corolario:

(MAS23)         

(MAS24)         

Demostración. (MAS23) es una relación obvia. Probaremos (MAS24). Con este propósito partiremos de (MAS16):

           

                       

                                  

Selección del tamaño de la muestra

Tenemos el propósito de estimar, mediante un muestreo aleatorio simple sin reemplazo, la proporción p de veces en que aparece el valor 1 en una población finita binaria A. En el teorema MAS9 declaramos que es un estimador insesgado de p, y del teorema MAS10 se desprende que dicho estimador disminuye su variación alrededor de p conforme crecen los tamaños de la muestra en los estratos.

Si particularizamos el teorema MAS5 a esta situación podemos enunciar:

Teorema MAS12. Sea n el tamaño de la muestra en un muestreo simple sin reemplazo de poblaciones finitas. Sea p la proporción de unidades en la población a las que les corresponde el valor 1. Sea  la proporción de veces en que aparece el valor 1 en la muestra. Entonces, para un nivel de confianza 1 - a y un error de muestreo e tiene lugar:

(MAS25)         

Demostración. Partiremos de la expresión (MAS14) y para luego sustituir por su equivalente de acuerdo a la expresión (MAS23):

               

Multiplicando numerador y denominador por (N-1)/N encontramos (MAS25).

Consideraciones prácticas para la determinación del tamaño de la muestra

En la expresión (MAS26) B(a) debe sustituirse por 1.95996278740841, o por 1.96, o definitivamente por 2, para obtener un nivel de confianza del 95%.

La cantidad e, por su parte, depende del nivel de precisión de muestreo deseado. Cuanto más pequeño sea, más grande será la precisión, y más grande también será el tamaño de muestra resultante. Se recomienda e = 0.05, o valores menores si la precisión es un factor fundamental por la trascendencia de la decisión a tomar con base en el estudio.

En (MAS25) aparece la cantidad . Esta cantidad es desconocida ya que de hecho es el propósito mismo del muestreo. Las sugerencias para resolver este viaje en círculo son: a) utilizar en su lugar un estimador obtenido en experimentos previos o en una prueba piloto; y b) Ante la ausencia de información sobre  utilizar el valor 0.5 que produce el máximo valor de  asegurando con ello un error de muestreo menor o igual al establecido para el estudio.