1.3 Diseño de Ponderadores

Considerando que a partir de las entrevistas efectivamente realizadas se desea extrapolar a la población objetivo respectiva, es necesario ponderar adecuadamente a cada encuestado según su representación en la población objetivo. Para esto, en cada ola del estudio se proveen ponderadores que permiten ajustar por las diferencias en atributos demográficos de la muestra de ELSOC en relación a la población objetivo. Los ponderadores que incluye la base de datos de ELSOC son el producto de tres factores: Un peso de diseño, un ajuste por no respuesta, y un ajuste mediante post-estratificación.

A continuación se describe el proceso de elaboración de dichos ponderadores3 para lograr una correspondencia entre la muestra y la población objetivo.

1.3.1 Pesos de diseño

El primer paso en la construcción de los ponderadores de ELSOC corresponde a considerar el inverso de la probabilidad de selección de un individuo a la muestra. En este caso la probabilidad de selección del individuo i de la vivienda j que pertenece a la manzana l dentro del estrato k, Pijlk viene dada por:

Pijlk=πi|jlkπj|lkπlk

Donde:

  • πi|jlk es la probabilidad de que el individuo i sea seleccionado en la muestra dado que la vivienda dónde vive y la manzana dónde se localiza fueron seleccionadas,dentro del estrato k.
  • πj|lk es la probabilidad de que la vivienda j sea seleccionada en la muestra dado que la manzana l (que contiene a la vivienda j) fue seleccionada.
  • πlk es la probabilidad de que lamanzana l del estrato k sea seleccionada en la muestra.

Se define el ponderador de diseño wijlk como el inverso de la probabilidad de selección de cada individuo en la muestra:

wijlk=1Pijlk

Las probabilidades que componen la probabilidad de selección son calculadas mediante:

πlk=nkMlkMk

πj|lk=mlkMlk

πi|jlk=1Njlk

Donde se tiene que nk es el número de manzanas a seleccionar del estrato k, Mlk es el número de viviendas de la manzana l del estrato k, Mk es el número total de viviendas del estrato k. mlk es el número de viviendas a encuestar dentro de la manzana l, Mk es el número actualizado de viviendas de la manzana l post-empadronamiento, y Njlk es el número de personas de la población objetivo que vive en la vivienda j de la manzana l del estrato k.

1.3.2 Ajustes por no respuesta

El ponderador anterior luego es ajustado en base a la no respuesta inicial de la manzana en la que se encuentra cada individuo. De este modo, damos más peso a las observaciones que están en manzanas donde pocas personas responden.

Este ajuste se realiza en base a un factor de no respuesta para la manzana fl, y se estima como el inverso de la proporción de viviendas dentro de la manzana l que responden la encuesta.

fl=mlrespl

Donde ml es el número de viviendas seleccionadas para estar en la muestra, y respl es el número de viviendas seleccionadas que participan en ELSOC.

1.3.3 Post-Estratificación

La post-estratificación es un ajuste que suele hacerse en las encuestas para incorporar información conocida sobre la población en el análisis de datos de encuestas. Su objetivo principal es que la distribución de los estimadores ponderados sean capaces de reproducir la distribución poblacional en variables claves como totales regionales y por sexo.

El ajuste de no respuesta puede pensarse como un factor que ajusta:

ps=Nj/Nj^ Donde Nj es el número total de personas en la población dentro del estrato j (Por ejemplo, número total de mujeres en la población), y N^j es el total estimado de dicho total a partir de los datos de la muestra.

Finalmente, los ponderadores de corte transversal de ELSOC tienen la forma:

w=wdisflps Es decir, son una combinación de la probabilidad de inclusión de los individuos, un ajuste por no respuesta en la manzana en la que residen y un ajuste de post-estratificación.

1.3.4 Ponderadores Longitudinales

El uso de ponderadores en análisis estadísticos tiene múltiples motivaciones, una de las más importantes radica en el interés por evitar sesgos debido al diseño muestral del estudio. Dada la naturaleza longitudinal de ELSOC interesa particularmente poder controlar por los sesgos de atrición que se derivan de la existencia de patrones sistemáticos en la no participación del estudio posterior a la primera ola. Otra motivación relevante para el uso de estimadores ponderados es su capacidad para incorporar información conocida sobre la población objetivo en la construcción de los ponderadores. Para lograr esto, se ajustan los pesos de manera que puedan reproducir totales o proporciones poblacionales.

Se ha generado un informe completo respecto a la generación y uso de los ponderadores longitudinales para los datos ELSOC, que es posible revisar en el sitio https://pondedradores-long-elsoc.netlify.app.


  1. Dichos ponderadores pueden entenderse como “ponderadores de corte transversal”, ya que se ignoran los problemas derivados de su naturaleza longitudinal.↩︎