Bases de microdados
Reconhecendo a relevância das Pesquisas TIC e atendendo à crescente demanda por microdados, o Centro Regional de Estudos para o Desenvolvimento da Sociedade da Informação (Cetic.br), departamento do Núcleo de Informação e Coordenação do Ponto BR (NIC.br), detalha abaixo os passos para que usuários e usuárias possam ter acesso aos arquivos de microdados anonimizados.
Microdados são a menor fração de um dado coletado em uma pesquisa. Retrata, por meio de códigos numéricos, a resposta individual dos(as) informantes ao questionário aplicado. Por meio do agrupamento dos microdados em certas unidades (como região geográfica ou classe social, por exemplo) são gerados novos dados agregados, permitindo a construção de dados sobre unidades mais amplas.
As bases de microdados podem ser lidas por software específicos, como R, SAS e SPSS, que permitem à pessoa usuária a manipulação para a composição de novas agregações e, consequentemente, novas análises.
Para sua disponibilização, as bases de microdados passam por um processo de anonimização, de modo a preservar o sigilo dos(as) informantes.
O processo de anonimização da base de microdados tem como objetivo preservar o sigilo dos(as) informantes e pode ser realizado por meio de métodos de acesso restrito aos dados ou por métodos de restrição dos dados disponibilizados.
Os métodos de acesso restrito aos dados buscam delimitar quem e/ou sob quais condições será consentido o acesso aos dados, limitando, por exemplo, as pessoas autorizadas a manuseá-los, permitindo o acesso a dados protegidos por senhas/criptografia ou compartilhando os dados sob um termo/licença de uso.
Os métodos de restrição dos dados buscam limitar os dados disponibilizados para protegê-los. Isto pode ser realizado por métodos de supressão dos dados disponíveis (por exemplo, dados que poderiam identificar indivíduos) ou pela inclusão de ruído na base de dados (ou seja, pela inclusão de ocorrências fictícias).
Estas técnicas são utilizadas para possibilitar a preservação do sigilo dos(as) informantes e, ao mesmo tempo, o acesso às bases de microdados de pesquisas. Nas bases de microdados das Pesquisas TIC, são utilizados os métodos de acesso restrito e/ou restrição dos dados, combinando-os nos casos das pesquisas com estabelecimentos.
Os métodos de proteção da confidencialidade empregados na construção das bases de microdados se basearam nos seguintes princípios orientadores:
- 1. Desidentificação: remoção de todas as informações identificadoras para garantir a desidentificação antes da publicação das bases de microdados. Essas são informações que permitiriam a identificação direta das unidades respondentes, tal como nomes, números de identificação e dados de contato.
- 2. Generalização e supressão: generalização ou omissão de informações quando necessário, a fim de evitar que os dados possam ser vinculados a unidades respondentes específicas. A recodificação é usada como método de generalização para reduzir o número de categorias de algumas variáveis. Adicionalmente, a supressão é realizada após a recodificação a fim de omitir valores de determinadas variáveis para algumas unidades respondentes. Esses métodos têm por objetivo diminuir a quantidade de observações únicas e, consequentemente, reduzir o risco de identificação, sendo fundamental para a proteção da confidencialidade.
- 3. Utilidade do uso: avaliação das bases de microdados resultantes do tratamento para proteção da confidencialidade considerando o plano tabular divulgado para a pesquisa. As estatísticas produzidas com essas bases não apresentam diferenças significativas quando comparadas à tabulação dos dados originais da pesquisa.
Como parte do processo de disseminação dos resultados das Pesquisas TIC, o Cetic.br|NIC.br disponibiliza as bases de microdados das pesquisas e sua documentação via download ou mediante Termo de Acesso e Uso. Há três tipos de bases de microdados disponibilizadas via download: 1) bases originais desidentificadas (TIC Domicílios e TIC Kids Online Brasil); 2) bases com tratamento para controle estatístico de confidencialidade (TIC Empresas); e 3) bases originais, disponíveis via Termo de Acesso e Uso (conforme detalhamento abaixo).
Bases originais desidentificadas disponíveis para download
Para download na página do Cetic.br|NIC.br estão disponíveis as bases desidentificadas de microdados das pesquisas TIC Domicílios e TIC Kids Online Brasil a partir de 2015.
A desidentificação é realizada para preservar o sigilo dos(as) informantes. O processo consiste na remoção das informações que possibilitem a identificação direta de respondentes.
Os documentos disponibilizados são:
- Base de microdados;
- Instrumento de coleta, com o questionário aplicado aos(às) respondentes;
- Relatório metodológico, com detalhes sobre a metodologia da pesquisa;
- Relatório de coleta de dados, com detalhes sobre a coleta de dados de cada edição da pesquisa;
- Dicionário de dados, com a identificação das variáveis contidas na base de microdados.
Todas as bases de microdados são disponibilizadas anonimizadas para preservar o sigilo dos informantes. Os dicionários das bases de dados – legendas das variáveis e legendas associadas às opções de resposta – são disponibilizados exclusivamente em português.
Bases de dados desidentificadas com tratamento para controle estatístico de confidencialidade disponíveis para download
Para download na página do Cetic.br|NIC.br estão disponíveis as bases de microdados com tratamento para controle estatístico de confidencialidade da pesquisa TIC Empresas a partir de 2015. Já as bases originais dessa pesquisa (isto é, sem tratamento para controle estatístico de confidencialidade) podem ser acessadas via Termo de Acesso e Uso (conforme detalhamento abaixo).
Os documentos disponibilizados são:
- Base de microdados com tratamento para controle estatístico de confidencialidade;
- Instrumento de coleta, com o questionário aplicado aos(às) respondentes;
- Relatório metodológico, com detalhes sobre a metodologia da pesquisa;
- Relatório de coleta de dados, com detalhes sobre a coleta de dados de cada edição da pesquisa;
- Dicionário de dados, com a identificação das variáveis contidas na base de microdados.
Bases desidentificadas disponíveis via Termo de Acesso e Uso
Essas bases de microdados são disponibilizadas mediante a assinatura de um Termo de Acesso e Uso firmado entre uma instituição solicitante e o NIC.br.
A instituição solicitante deverá preencher o formulário com informações sobre o projeto, onde deverão ser especificadas quais são as bases de interesse (pesquisa e ano), todas as pessoas da instituição que estarão envolvidas no manuseio e na análise dos dados, além dos objetivos, da justificativa e da metodologia do estudo que será realizado a partir da base dos microdados. O formulário deverá ser enviado em formato PDF por e-mail para acordos.cetic@nic.br.
A partir da revisão e aceite das informações enviadas, será confeccionado o Termo de Acesso e Uso das bases, que será firmado entre o NIC.br e um(a) representante da instituição. Para que o termo seja assinado, é necessário o envio de documento que comprove que o(a) representante legal da instituição tem poderes para assinar este tipo de documento.
Vale destacar que o Termo é assinado uma única vez entre as Partes, até seu vencimento. Uma vez firmado, futuras solicitações de bases de dados podem ser encaminhadas ao Cetic.br|NIC.br a qualquer momento, por e-mail.
Via Termo de Acesso e Uso das bases de microdados estão disponíveis as seguintes bases:
Seguindo as Boas Práticas para Dados na Web (Data on the Web Best Practices), do W3C, os documentos e as bases de microdados das Pesquisas TIC domiciliares são disponibilizadas no site sob a Licença Atribuição 4.0 Internacional (CC BY 4.0). Isto significa que você pode compartilhar e adaptar o material e, sempre que o fizer ou que utilizar qualquer um dos materiais disponibilizados, deverá dar o crédito ao Cetic.br|NIC.br apropriadamente. Acesse aqui a licença na íntegra.
Caso você tenha alguma dúvida ou sugestão a respeito do acesso às bases de microdados, documentos disponibilizados ou outros assuntos relativos às bases, entre em contato conosco.