Estimación de
proporciones
Por:
Dr. Luis Antonio Pérez González
Instituto Tecnológico de Orizaba - ipac
Contenido
Selección del tamaño de la muestra
Consideraciones prácticas para la
determinación del tamaño de la muestra
Sea A una población cuyas unidades presentan sólo una característica de tipo binario, entendiendo por esto que a la unidad h-ésima de A le corresponde un solo valor ah e {0,1}, h=1, ..., N. Las características de tipo binario se presentan en muchísimas situaciones prácticas: se tiene o no un bien determinado; se vota o no por un partido político determinado; un producto es bueno o defectuoso; una empresa ahorra o no energía; una empresa mantiene o abandonó un conjunto de medidas que implementó para ahorrar energía; etc.
Observación. Al desarrollar los conceptos relativos a la estimación de una media, no impusimos a ah el que tomaran algún conjunto específico de valores. Por otra parte, al estimar proporciones estamos exigiendo ah e {0,1}. Luego, la estimación de proporciones es una particularización del caso antes estudiado y, por consiguiente, todas las afirmaciones que hicimos para determinar el tamaño de la muestrea al estimar las medias, aplican al presente caso. Por lo tanto podemos aplicar directamente la expresión (MAS14) para estimar el tamaño de la muestra en el caso que ahora nos ocupa. Sin embargo, antes de proceder a esto destacaremos algunas consecuencias de la particularización que estamos abordando para sacar provecho de ella.
Sea X1, X2, …, Xn, n < N, una muestra aleatoria simple sin reemplazo extraída de A. Consideremos las notaciones siguientes:
(MAS15) ![]()
(MAS16) ![]()
En las anteriores notaciones p y s2 representan la media y las varianzas poblacionales,
respectivamente, mientras que
y s2 representan a la media y
varianza muestrales.
Teorema (MAS6). El parámetro p representa la proporción de unidades en la población a las que les corresponde el valor 1.
Demostración.
En efecto,
es igual al número de
unos en la población, y al dividir sobre N esta sumatoria, obtenemos a la
proporción de unos en la misma población. ■
Teorema (MAS7). s2 = p(1-p)
Demostración.
![]()
■
Los siguientes teoremas (teoremas MAS8 al MAS11), no serán demostrados, ya que, como hemos afirmado líneas arriba, son casos particulares de los teoremas MAS1 al MAS5 que enunciamos al hablar del muestreo aleatorio simple para la estimación de medias.
Teorema MAS8. Sea X1, X2, …, Xn, n < N, una muestra aleatoria simple sin reemplazo extraída de la población finita binaria A. Sea p la proporción de unidades en la población a las que les corresponde el valor 1. Entonces:
(MAS17) ![]()
Corolario. Si X1, X2, …, Xn, n < N, es una muestra aleatoria simple sin reemplazo extraída de la población finita binaria A, entonces
![]()
Teorema MAS9.
es un estimador
insesgado (no desplazado) de la media poblacional p, es decir:
(MAS18)
Teorema MAS10.
(MAS19)
Corolario: Si
(MAS20) ![]()
entonces
(MAS21) ![]()
Teorema MAS11. Se cumplen las siguientes tres propiedades:
(MAS22) 
Corolario:
(MAS23) ![]()
(MAS24) ![]()
Demostración. (MAS23) es una relación obvia. Probaremos (MAS24). Con este propósito
partiremos de (MAS16):
![]()

■
Tenemos el propósito de estimar, mediante un muestreo
aleatorio simple sin reemplazo, la proporción p de veces en que aparece el
valor 1 en una población finita binaria A. En el teorema MAS9 declaramos que
es un estimador insesgado de p, y del teorema MAS10 se desprende
que dicho estimador disminuye su variación alrededor de p conforme crecen los
tamaños de la muestra en los estratos.
Si particularizamos el teorema MAS5 a esta situación podemos enunciar:
Teorema MAS12.
Sea n el tamaño de la muestra en un muestreo simple sin reemplazo de poblaciones
finitas. Sea p la proporción de unidades en la población a las que les
corresponde el valor 1. Sea
la proporción de
veces en que aparece el valor 1 en la muestra. Entonces, para un nivel de
confianza 1 - a y un
error de muestreo e
tiene lugar:
(MAS25) 
Demostración.
Partiremos de la expresión (MAS14) y para luego sustituir
por su equivalente de acuerdo a la expresión (MAS23):
Multiplicando
numerador y denominador por (N-1)/N encontramos (MAS25). ■
En la expresión (MAS26) B(a) debe sustituirse por 1.95996278740841, o por 1.96, o definitivamente por 2, para obtener un nivel de confianza del 95%.
La cantidad e, por su parte, depende del nivel de precisión de muestreo deseado. Cuanto más pequeño sea, más grande será la precisión, y más grande también será el tamaño de muestra resultante. Se recomienda e = 0.05, o valores menores si la precisión es un factor fundamental por la trascendencia de la decisión a tomar con base en el estudio.
En (MAS25) aparece la cantidad
. Esta cantidad es desconocida ya que de hecho es el
propósito mismo del muestreo. Las sugerencias para resolver este viaje en
círculo son: a) utilizar en su lugar un estimador obtenido en experimentos
previos o en una prueba piloto; y b) Ante la ausencia de información sobre
utilizar el valor 0.5
que produce el máximo valor de
asegurando con ello un
error de muestreo menor o igual al establecido para el estudio.