1.3 Diseño de Ponderadores

Considerando que a partir de las entrevistas efectivamente realizadas se desea extrapolar a la población objetivo respectiva, es necesario ponderar adecuadamente a cada encuestado según su representación en la población objetivo. Para esto, en cada ola del estudio se proveen ponderadores que permiten ajustar por las diferencias en atributos demográficos de la muestra de ELSOC en relación a la población objetivo. Los ponderadores que incluye la base de datos de ELSOC son el producto de tres factores: Un peso de diseño, un ajuste por no respuesta, y un ajuste mediante post-estratificación.

A continuación se describe el proceso de elaboración de dichos ponderadores3 para lograr una correspondencia entre la muestra y la población objetivo.

1.3.1 Pesos de diseño

El primer paso en la construcción de los ponderadores de ELSOC corresponde a considerar el inverso de la probabilidad de selección de un individuo a la muestra. En este caso la probabilidad de selección del individuo \(i\) de la vivienda \(j\) que pertenece a la manzana \(l\) dentro del estrato \(k\), \(P_{ijlk}\) viene dada por:

\[P_{ijlk} = \pi_{i|jlk}\pi_{j|lk}\pi_{lk}\]

Donde:

  • \(\pi_{i|jlk}\) es la probabilidad de que el individuo \(i\) sea seleccionado en la muestra dado que la vivienda dónde vive y la manzana dónde se localiza fueron seleccionadas,dentro del estrato \(k\).
  • \(\pi_{_j|lk}\) es la probabilidad de que la vivienda \(j\) sea seleccionada en la muestra dado que la manzana \(l\) (que contiene a la vivienda \(j\)) fue seleccionada.
  • \(\pi_{lk}\) es la probabilidad de que lamanzana \(l\) del estrato \(k\) sea seleccionada en la muestra.

Se define el ponderador de diseño \(w_{ijlk}\) como el inverso de la probabilidad de selección de cada individuo en la muestra:

\[w_{ijlk}=\frac{1}{ P_{ijlk}}\]

Las probabilidades que componen la probabilidad de selección son calculadas mediante:

\[\pi_{lk} = n_k\frac{M_{lk}}{M_k}\]

\[\pi_{j|lk} = \frac{m_{lk}}{M'_{lk}}\]

\[\pi_{i|jlk} = \frac{1}{N_{jlk}}\]

Donde se tiene que \(n_k\) es el número de manzanas a seleccionar del estrato \(k\), \(M_{lk}\) es el número de viviendas de la manzana \(l\) del estrato \(k\), \(M_k\) es el número total de viviendas del estrato \(k\). \(m_{lk}\) es el número de viviendas a encuestar dentro de la manzana \(l\), \(M'_k\) es el número actualizado de viviendas de la manzana \(l\) post-empadronamiento, y \(N_{jlk}\) es el número de personas de la población objetivo que vive en la vivienda \(j\) de la manzana \(l\) del estrato \(k\).

1.3.2 Ajustes por no respuesta

El ponderador anterior luego es ajustado en base a la no respuesta inicial de la manzana en la que se encuentra cada individuo. De este modo, damos más peso a las observaciones que están en manzanas donde pocas personas responden.

Este ajuste se realiza en base a un factor de no respuesta para la manzana \(f_l\), y se estima como el inverso de la proporción de viviendas dentro de la manzana \(l\) que responden la encuesta.

\[f_l=\frac{m_l}{resp_l}\]

Donde \(m_l\) es el número de viviendas seleccionadas para estar en la muestra, y \(resp_l\) es el número de viviendas seleccionadas que participan en ELSOC.

1.3.3 Post-Estratificación

La post-estratificación es un ajuste que suele hacerse en las encuestas para incorporar información conocida sobre la población en el análisis de datos de encuestas. Su objetivo principal es que la distribución de los estimadores ponderados sean capaces de reproducir la distribución poblacional en variables claves como totales regionales y por sexo.

El ajuste de no respuesta puede pensarse como un factor que ajusta:

\[ps=N_j/\hat{N_j}\] Donde \(N_j\) es el número total de personas en la población dentro del estrato j (Por ejemplo, número total de mujeres en la población), y \(\hat N_j\) es el total estimado de dicho total a partir de los datos de la muestra.

Finalmente, los ponderadores de corte transversal de ELSOC tienen la forma:

\[w=w^{dis}*f_l*ps\] Es decir, son una combinación de la probabilidad de inclusión de los individuos, un ajuste por no respuesta en la manzana en la que residen y un ajuste de post-estratificación.

1.3.4 Ponderadores Longitudinales

El uso de ponderadores en análisis estadísticos tiene múltiples motivaciones, una de las más importantes radica en el interés por evitar sesgos debido al diseño muestral del estudio. Dada la naturaleza longitudinal de ELSOC interesa particularmente poder controlar por los sesgos de atrición que se derivan de la existencia de patrones sistemáticos en la no participación del estudio posterior a la primera ola. Otra motivación relevante para el uso de estimadores ponderados es su capacidad para incorporar información conocida sobre la población objetivo en la construcción de los ponderadores. Para lograr esto, se ajustan los pesos de manera que puedan reproducir totales o proporciones poblacionales.

Se ha generado un informe completo respecto a la generación y uso de los ponderadores longitudinales para los datos ELSOC, que es posible revisar en el sitio https://pondedradores-long-elsoc.netlify.app.


  1. Dichos ponderadores pueden entenderse como “ponderadores de corte transversal”, ya que se ignoran los problemas derivados de su naturaleza longitudinal.↩︎