Bases de microdatos
Al reconocer la importancia de las Encuestas TIC y prestar atención a la creciente demanda de microdatos, el Centro Regional de Estudios para el Desarrollo de la Sociedad de la Información (Cetic.br), departamento del Núcleo de Información y Coordinación del Punto BR (NIC.br), detalla a continuación los pasos para que usuarios y usuarias puedan acceder a los archivos de microdatos anonimizados.
Los microdatos son la fracción menor de un dato recolectado en una encuesta. Retratan, mediante códigos numéricos, la respuesta individual de los y las informantes al cuestionario aplicado. A través del agrupamiento de los microdatos en ciertas unidades (como regiones geográficas o clase social, por ejemplo), es posible generar nuevos datos agregados y esto permite la construcción de datos respecto a unidades de mayor amplitud.
Las bases de microdatos pueden ser visualizadas mediante programa específico, como R, SAS y SPSS, que permiten que la persona usuaria las manipule para la composición de nuevas agregaciones y, consecuentemente, nuevos análisis.
Para su puesta a disposición, las bases de microdatos pasan por un proceso de anonimización, de modo tal que se preserve la identificación de los y las informantes.
El proceso de anonimización de la base de microdatos tiene como objetivo preservar la identidad de los y las informantes. Puede ser realizado a través de métodos de acceso restringido a los datos, o bien por métodos de restricción de los datos puestos a disposición.
Los métodos de acceso restringido a los datos buscan determinar quién y/o bajo qué condiciones será permitido acceder a los datos y limita, por ejemplo, a las personas autorizadas a manipularlos. Esto permite el acceso a datos protegidos por contraseñas/criptografía o compartir los datos bajo términos/licencias de uso.
Los métodos de restricción de datos pretenden limitar el acceso a los datos disponibles con el objeto de protegerlos. Esto puede efectuarse utilizando métodos de supresión de los datos disponibles (por ejemplo, de datos que podrían identificar a individuos), o bien por la inclusión de ruido en la base de datos (es decir, incluyendo informaciones ficticias).
Dichas técnicas son utilizadas para permitir preservar la confidencialidad de los y las informantes y, al mismo tiempo, el acceso a las bases de microdatos de las encuestas. En las bases de microdatos de las Encuestas TIC se aplican los métodos de acceso restringido y/o la restricción de datos, combinándolos en los casos de las encuestas que involucran establecimientos.
Los métodos de protección de la confidencialidad empleados en la construcción de las bases de microdatos se basaron en los siguientes principios orientadores:
- 1. Desidentificación: eliminación de toda la información identificativa para garantizar la desidentificación antes de la publicación de las bases de microdatos. Se trata de información que permitiría la identificación directa de las unidades respondientes, como nombres, números de identificación y datos de contacto.
- 2. Generalización y supresión: generalización u omisión de información cuando sea necesario, con el fin de evitar que los datos puedan vincularse a unidades respondientes específicas. La recodificación se utiliza como método de generalización para reducir el número de categorías de algunas variables. Adicionalmente, la supresión se lleva a cabo tras la recodificación con el objetivo de omitir valores de determinadas variables para algunas unidades respondientes. Estos métodos tienen como objetivo disminuir la cantidad de observaciones únicas y, en consecuencia, reducir el riesgo de identificación, siendo fundamentales para la protección de la confidencialidad.
- 3. Utilidad del uso: evaluación de las bases de microdatos resultantes del tratamiento para la protección de la confidencialidad considerando el plan tabular divulgado para la encuesta. Las estadísticas producidas con estas bases no presentan diferencias significativas al compararlas con la tabulación de los datos originales de la encuesta.
Como parte del proceso de difusión de los resultados de las Encuestas TIC, Cetic.br|NIC.br pone a disposición las bases de microdatos de las encuestas y su documentación, a las que puede accederse a través de su descarga o mediante Término de Acceso y Uso. Hay tres tipos de bases de microdatos disponibles para descarga: 1) bases originales desidentificadas (TIC Domicilios y TIC Kids Online Brasil); 2) bases con tratamiento para el control estadístico de la confidencialidad (TIC Empresas); y 3) bases originales, disponibles mediante Término de Acceso y Uso (según el detalle a continuación).
Bases originales desidentificadas disponibles para descarga
Están disponibles para descarga en la página de Cetic.br|NIC.br las bases desidentificadas de microdatos de las encuestas TIC Domicilio y TIC Kids Online Brasil a partir de 2015.
La desidentificación se realiza para preservar la confidencialidad de los y las informantes. El proceso consiste en la eliminación de la información que permita la identificación directa de los y las respondientes.
Los documentos disponibles son:
- Base de microdatos;
- Instrumento de recolección, con el cuestionario aplicado a los y las respondientes;
- Informe metodológico, con detalles sobre la metodología de la encuesta;
- Informe de recolección de datos, con detalles sobre la recolección de datos de cada edición de la encuesta;
- Diccionario de datos, con la identificación de las variables contenidas en la base de microdatos.
Todas las bases de microdatos se ponen a disposición anonimizadas para preservar la confidencialidad de los informantes. Los diccionarios de las bases de datos – leyendas de las variables y leyendas asociadas a las opciones de respuesta – se encuentran disponibles exclusivamente en portugués.
Bases de datos desidentificadas con tratamiento para el control estadístico de la confidencialidad disponibles para descarga
Están disponibles para descarga en la página de Cetic.br|NIC.br las bases de microdatos con tratamiento para el control estadístico de la confidencialidad de la encuesta TIC Empresas a partir de 2015. Las bases originales de esta encuesta (es decir, sin tratamiento para el control estadístico de la confidencialidad) pueden ser accedidas mediante Término de Acceso y Uso (según el detalle a continuación).
Los documentos disponibles son:
- Base de microdatos con tratamiento para el control estadístico de la confidencialidad;
- Instrumento de recolección, con el cuestionario aplicado a los y las respondientes;
- Informe metodológico, con detalles sobre la metodología de la encuesta;
- Informe de recolección de datos, con detalles sobre la recolección de datos de cada edición de la encuesta;
- Diccionario de datos, con la identificación de las variables contenidas en la base de microdatos.
Bases desidentificadas disponibles mediante Término de Acceso y Uso
Estas bases de microdatos se ponen a disposición mediante la firma de un Término de Acceso y Uso entre una institución solicitante y el NIC.br.
La institución solicitante deberá completar el formulario con información sobre el proyecto, especificando qué bases son de interés (encuesta y año), todas las personas de la institución que estarán involucradas en el manejo y análisis de los datos, así como los objetivos, la justificación y la metodología del estudio que se realizará a partir de la base de microdatos. El formulario deberá enviarse en formato PDF por correo electrónico a: acordos.cetic@nic.br.
Tras la revisión y aprobación de la información enviada, se elaborará el Término de Acceso y Uso de las bases, que será firmado entre el NIC.br y un(a) representante de la institución. Para que el término pueda ser firmado, es necesario enviar un documento que acredite que el representante legal de la institución tiene poderes para firmar este tipo de documento.
Cabe destacar que el término se firma una única vez entre las Partes, hasta su vencimiento. Una vez firmado, futuras solicitudes de bases de datos pueden ser enviadas a Cetic.br|NIC.br en cualquier momento, por correo electrónico.
Mediante Término de Acceso y Uso de las bases de microdatos están disponibles las siguientes bases:
De acuerdo con las Buenas Prácticas para Datos en la Web (Data on the Web Best Practices) del W3C, los documentos y las bases de microdatos de las Encuestas TIC de hogares están disponibles en el sitio bajo la Licencia Atribución 4.0 Internacional. Esto implica que usted puede compartir y adaptar el material, siempre y cuando al hacerlo, o al utilizar cualquier material puesto a disposición, otorgue los debidos créditos a Cetic.br|NIC.br. Acceda aquí a la versión completa de los términos de la licencia.
En caso de que usted tenga alguna duda o sugerencia respecto al acceso a las bases de microdatos, documentos puestos a disposición u otros asuntos relativos a las bases, entre en contacto con nosotros.