3. Dados políticos em arquivos eleitorais

Entre os dados mais importantes nos arquivos eleitorais do analista eleitoral estão os registros de se alguém está ou não registrado para votar e se votou em uma determinada eleição. Esses registros individuais de registro e participação vêm diretamente dos registros mantidos por cada estado para cada eleição. O registro de comparecimento indica se alguém votou ou não em uma determinada eleição, embora não forneça o candidato ou partido escolhido. O registro de registro pode incluir em qual partido político o indivíduo está registrado (em estados onde os eleitores podem se registrar por partido). Quando combinados com outros dados do arquivo eleitoral, é possível criar uma imagem rica de quem está registrado e quem compareceu para votar nas eleições anteriores.


Além disso, embora o histórico de votos de um indivíduo esteja prontamente disponível através dos registros eleitorais oficiais em todos os 50 estados e no Distrito de Columbia, os arquivos do eleitor comercial normalmente oferecem pontuações para coisas como partidarismo e comparecimento esperado para futuras eleições geradas por meio de modelos preditivos. Este capítulo explorará a disponibilidade e a precisão dos dados políticos nos arquivos eleitorais, tanto brutos quanto modelados.

O histórico de votação é bastante consistente entre os arquivos

Os analistas eleitorais valorizam muito a disponibilidade de registros de participação nas eleições anteriores. Ser capaz de documentar a participação em diferentes tipos de eleições (por exemplo, anos presidenciais e offs) permite que os pesquisadores entendam melhor como os eleitores diferem em motivação e recursos para participar. Obviamente, é possível perguntar aos entrevistados sobre a votação em eleições anteriores. Mas os pesquisadores reconhecem que as memórias sobre eventos que ocorreram há dois ou quatro anos (ou mais) são potencialmente falhas, especialmente para os entrevistados que não estão especialmente interessados ​​em política. Assim, ter registros precisos de comparecimento às pessoas é um ativo importante dos arquivos do eleitor comercial. Mesmo com acesso direto aos arquivos do eleitor do estado, um pesquisador pode não ser capaz de documentar o comportamento anterior de voto de um indivíduo se ele mudou seu estado de residência durante o período de interesse.


Uma advertência importante a se considerar com o histórico de votos é que, embora a presença de um registro de votação quase certamente signifique que uma pessoa votou naquela eleição, oausênciade um registro não significa que eles definitivamente fizeramnãovoto. A falta de um registro pode indicar que alguém não votou, que os dados correspondentes perderam um ou mais registros eleitorais para um indivíduo ou até mesmo que a correspondência é para a pessoa errada. Mesmo quando a correspondência é para a pessoa correta, o registro eleitoral anexado a essa pessoa no arquivo comercial pode estar desatualizado ou incorreto.

A situação é ainda mais ambígua para indivíduos que não correspondem a um arquivo eleitoral. Uma vez que os arquivos eleitorais são construídos com base nos registros oficiais do estado e posteriormente expandidos com registros comerciais não oficiais, a ausência de correspondênciamaioindicam que a pessoa não possui registro estadual ou registro eleitoral no local onde mora atualmente. Isso pode significar que ele ou ela não está registrado e, portanto, provavelmente não votou nas últimas eleições. Mas isso não pode ser dito com certeza, uma vez que falhas de correspondência podem ocorrer mesmo quando existe um registro de estado (pelos motivos discutidos anteriormente).

Ao avaliar o comparecimento às eleições presidenciais de 2016, tende a haver um grau bastante alto de acordo entre os arquivos sobre o histórico de votos de um indivíduo. Provavelmente, isso ocorre porque todos os fornecedores utilizam os arquivos de eleitores do mesmo estado como matéria-prima. Esse é especialmente o caso de quatro dos cinco arquivos, que produzem taxas de participação relativamente semelhantes. As estimativas do Arquivo 1 ao Arquivo 4 variam de um mínimo de 71% que estão listados como tendo votado em 2016 a um máximo de 78%. No entanto, o Arquivo 5 existe como um outlier. Por ser o arquivo com a menor taxa de correspondência, o Arquivo 5 produz a estimativa mais alta de participação em 2016, de 86%. Embora essas taxas de participação estejam em linha com a participação auto-relatada no Painel de Tendências Americanas, as taxas de participação aqui são consideravelmente mais altas do que a taxa de participação conhecida em cada eleição. No entanto, conforme observado no Capítulo 2, os respondentes politicamente engajados são mais propensos do que os respondentes menos engajados a serem comparados aos arquivos do eleitor. Isso leva a estimativas mais altas de participação em cada eleição.



Para eliminar a variação nas taxas de participação produzida por diferenças nas taxas de correspondência entre fornecedores, as taxas de participação foram calculadas para cerca de quatro em dez (42%) painelistas que foram correspondidos por todos os cinco arquivos. Entre esses painelistas, 85% têm registros de comparecimento idênticos nos cinco arquivos (75% são registrados como tendo votado em todos os cinco e 10% não têm registro de voto em todos os cinco). No nível agregado, a participação foi de 87% a 88% em quatro dos cinco arquivos, mas é 7 pontos menor no Arquivo 3 (81% de participação). O motivo dessa exceção não é claro.


Tal como acontece com a participação em 2016, os fornecedores variam um pouco em suas taxas de votação para 2012 e 2014. No entanto, ao restringir ao conjunto comum de correspondências entre todos os cinco fornecedores, a maior parte da variabilidade é eliminada (como foi para 2016): Participação as estimativas para 2014 variam entre 65% e 67%, e para 2012, entre 76% e 80%. Nessa análise, o Arquivo 3 não se destaca como excepcional, como aconteceu com a votação de 2016.8

O fato de as taxas de participação em 2012 serem consideravelmente mais baixas do que em 2016 ilustra a dificuldade de rastrear com precisão os registros de votação ao longo do tempo, mesmo para organizações que tornaram isso uma prioridade muito alta. A taxa real de participação entre os adultos elegíveis para votação em 2016 é estimada em 60%, enquanto a taxa de 2012 é apenas 1 ponto inferior (59%). E ainda, a taxa de participação de 2016 para os painelistas excedeu a taxa de 2012 por margens de 3 a 9 pontos nos cinco arquivos. É claro que o histórico de votos se perde conforme as pessoas mudam ou mudam de nome, apesar dos melhores esforços dos fornecedores para construir um histórico completo para aqueles em seus arquivos.

Erro de pesquisa no comparecimento relatado

Um dos desafios mais comuns enfrentados pelas pesquisas sobre eleições é a tendência de algumas pessoas dizerem que votaram quando não votaram. Este fenômeno tem recebido ampla atenção acadêmica, e grande parte da pesquisa se baseou em pesquisas combinadas com dados validados de participação eleitoral. Para muitas pessoas, votar é um comportamento socialmente desejável porque está de acordo com as noções tradicionais de dever cívico. Conseqüentemente, pode haver pressão para que as pessoas afirmem que votaram mesmo quando não o fizeram. Pesquisas anteriores documentaram que a incidência de declarações incorretas de comparecimento é maior entre as pessoas que valorizam a participação política e, como um grupo, já podem ter taxas de participação mais altas. Os arquivos eleitorais têm ajudado muito a compreensão dos pesquisadores sobre o erro na medição da participação eleitoral.


Como esperado, a taxa de participação auto-relatada em 2016 excedeu as estimativas do arquivo eleitoral entre os membros do painel em todos os cinco arquivos eleitorais. A superestimativa da participação variou de 4 pontos percentuais no Arquivo 5 a 13 pontos no Arquivo 3.

No entanto, ao contrário da maioria dos estudos que examinaram a supernotificação de votos, que normalmente usam uma única fonte de validação do eleitor, o Pew Research Center tem cinco fontes de evidências de comparecimento e, portanto, pode estar mais confiante de que falhas de correspondência ou erros na manutenção de registros por um único fonte pode levar a conclusões errôneas sobre a participação de um indivíduo. Se os pesquisadores estiverem confiantes na precisão das correspondências para um indivíduo, um registro em um arquivo em que eles votaram é uma forte evidência, mesmo que outros arquivos não forneçam nenhum registro de votação.

Os painelistas foram entrevistados logo após a eleição de 2016 sobre sua participação na eleição e perguntaram se e em quem votaram. A taxa de participação auto-relatada entre os painelistas (restrita aos cidadãos) foi de 77% (ponderada) - 17 pontos percentuais mais alta do que a taxa de participação estimada entre toda a população elegível para votar.

Essa superestimativa da participação é provavelmente uma consequência de três fatores diferentes. Um é (como discutido acima) o relatório incorreto dos entrevistados, movido pelo desejo de parecer mais engajado ou talvez pela impressão de um entrevistado de si mesmo como um cidadão zeloso que geralmente vota. Outra é que a amostra da pesquisa inclui pessoas que são mais politicamente engajadas do que o americano típico. A terceira é que ser pesquisado, e especialmente estar em um painel com pesquisas regulares, pode estimular o interesse de um entrevistado pela política e potencialmente motivá-lo a votar. Warren Miller, um renomado cientista político que foi co-autor da pesquisa seminal sobre eleições, 'The American Voter', disse uma vez que o American National Election Study era 'o projeto de mobilização de eleitores mais caro da história americana' porque parecia ter motivado muitos de seus respondentes votaram quando, de outra forma, não o teriam feito.


Os arquivos do eleitor fornecem evidências excelentes sobre a primeira dessas explicações - relatórios incorretos dos respondentes. Os autorrelatos de participação podem ser comparados com o registro verificado de votação para estimar a extensão do relato exagerado e as características daqueles que relataram exageradamente. Para fazer isso, os pesquisadores usaram uma estimativa composta de comparecimento com base nos registros em todos os cinco arquivos. Se algum arquivo incluir um registro de comparecimento do painelista, presume-se que o painelista tenha votado, mesmo que os outros arquivos não tenham encontrado um registro eleitoral. Se um membro do painel correspondente não tivesse registro de votação em nenhum arquivo, essa pessoa era considerada não-votante. Mas, como havia cinco fornecedores procurando por painelistas, os pesquisadores fizeram a suposição adicional de que painelistas incomparáveis ​​também eram não-votantes. A validade dessa suposição depende da precisão das correspondências. Consequentemente, antes de implementar esta etapa, os pesquisadores avaliaram a qualidade das correspondências comparando o nome e endereço de cada painelista com o nome e endereço no cadastro eleitoral que correspondia a ele. As correspondências consideradas possivelmente incorretas devido a inconsistências no nome ou endereço foram consideradas sem correspondência para os fins desta análise.9

Para revisar, se algum arquivo incluía um registro de participação do painelista, presumiu-se que o painelista votou, mesmo que outros arquivos não tenham encontrado um registro eleitoral. Todos os outros membros do painel foram considerados não votantes. Isso se baseia na suposição bastante forte de que os membros do painel que não puderam ser localizados e verificados como eleitores em qualquer arquivo oficial de eleitores por cinco fornecedores comerciais diferentes podem ser considerados como não tendo votado.

Usando essa abordagem, a taxa de participação verificada do arquivo eleitoral entre os painelistas foi de 65%, 5 pontos percentuais maior do que a melhor estimativa de participação nacional entre os adultos elegíveis. Um por cento entre os 65% são painelistas que disseram que não votaram, mas têm histórico de fazê-lo. Este pequeno grupo de menos de 20 indivíduos pode ter selecionado acidentalmente a opção errada na pesquisa, ou pode haver um erro no registro oficial de comparecimento. Cerca de um em cada cinco painelistas (22%) são não votantes validados (entrevistados que disseram não ter votado e para os quais não existe registro de votação).

O grupo restante consiste nos supernotificadores. Estes são os 12% de todos os adultos com direito a voto (cidadãos com 18 anos de idade ou mais) que disseram ter votado, mas nos quais nenhum registro pode ser localizado em cinco arquivos de eleitores. Demograficamente, esses indivíduos são mais homens do que mulheres (56% -44%), desproporcionalmente negros e hispânicos (17% cada, em comparação com cerca de 10% cada um entre os eleitores validados), muito mais democratas do que republicanos na filiação partidária e mais apoiadores de Hillary Clinton do que Donald Trump (56% Clinton, 35% Trump vs. 48% a 45% entre os eleitores verificados). Eles são muito mais propensos do que os não votantes validados a dizer que 'sempre' votam (44% contra 5%) e que seguem o que está acontecendo no governo e na política na maioria das vezes (36% contra 13%).10

Ter uma medida validada de quem votou e quem não votou torna possível montar um retrato mais confiável do eleitorado em 2016. Como a análise pós-eleitoral demonstrou, a composição do eleitorado de 2016 é importante para compreender a vitória de Donald Trump nas eleições de 2016, e - de forma mais ampla - que tipos de mudanças podem estar ocorrendo no sistema político dos EUA.

Os analistas geralmente contam com três fontes principais de dados sobre quem vota. Uma é a pesquisa de voto do National Election Pool (NEP), que fornece estimativas dos padrões de votação entre os diferentes grupos da população. Outro é o suplemento da Current Population Survey (CPS) do Censo dos Estados Unidos sobre registro e participação eleitoral, realizado logo após as eleições gerais. Um terceiro é o conjunto de pesquisas independentes, como o American Trends Panel e o American National Election Study.

A pesquisa de saída do NEP foi criticada por representar excessivamente indivíduos e minorias mais jovens, com ensino superior. A pesquisa do CPS encontrou um eleitorado menos instruído e com maior probabilidade de ser branco, assim como muitas pesquisas independentes.

Os membros do painel do American Trends que se identificam como tendo votado em 2016 se parecem muito com o eleitorado do CPS, especialmente no que diz respeito à categoria crítica de brancos não universitários. A amostra ATP de eleitores auto-relatados é de 43% brancos não universitários, quase o mesmo que na pesquisa CPS, e apenas 34% na pesquisa de saída. Mas os eleitores autodeclarados do ATP apoiaram Hillary Clinton por uma margem de seis pontos, 49% a 43%. Restringir a amostra para aqueles que são validados como tendo votado em pelo menos um dos arquivos eleitorais não muda muito a composição da amostra (embora a parcela de eleitores brancos não hispânicos aumente de 71% para 74%), mas o a margem de votos agora se aproxima do resultado da eleição real, 48% Clinton contra 46% Trump.

Usar apenas as correspondências em cada um dos arquivos de eleitores produz resultados semelhantes com relação à corrida de cavalos. Em comparação com a escolha de voto relatada entre todos os membros do painel em cada arquivo que disseram ter votado, a vantagem de Clinton sobre Trump entre os eleitores validados em cada arquivo foi menor. A vantagem de Clinton varia de 2 a 4 pontos nos cinco arquivos (contra 3 a 6 pontos entre todos os eleitores auto-relatados correspondidos em cada arquivo).

O status de registro eleitoral auto-relatado é mais obscuro do que a participação eleitoral

Comparado com a participação eleitoral, o registro eleitoral é uma questão de medição muito mais problemática para os pesquisadores de pesquisas. O fato de o registro eleitoral ser um status e não uma atividade significa que pode ser difícil de lembrar com precisão. Por um lado, a pessoa típica se registra para votar com muito menos frequência do que costuma votar. Para pessoas que votam raramente ou nunca, seu registro é em grande parte uma abstração - um status administrativo mantido pela autoridade eleitoral de seu estado sem a contribuição do indivíduo. Se alguém se registrou para votar há nove anos, mas não votou em cinco, ele ainda está registrado para votar? Sem uma chamada para o escritório eleitoral local, seria difícil para eles saber.

Além disso, há uma série de maneiras diferentes pelas quais os estados lidam com seus bancos de dados de registro eleitoral. Por exemplo, os estados limpam periodicamente os dados de registro eleitoral, seja porque alguém acredita que se mudou ou porque não votou durante um determinado período. Portanto, se um eleitor permanecer no mesmo endereço por muitos anos e puder manter seu registro, seja por meio de votação periódica ou porque seu estado permite que os registrantes permaneçam no arquivo sem votar ou confirmar sua residência, seu ato de registro mais recente é há muito tempo em seu passado. Isso adiciona uma fonte de erro para os eleitores que respondem a perguntas sobre seu registro, pois eles podem simplesmente não saber com certeza se estão registrados.

A abstração do registro eleitoral na mente de um entrevistado da pesquisa, no entanto, não significa que seu registro eleitoral não possa ser validado. Se um arquivo de eleitor estadual contém um registro do respondente em seu endereço atual, o respondente está definitivamente registrado para votar. Afinal, o arquivo eleitoral do estado é a fonte oficial de dados usada no dia da eleição para verificar os eleitores.

Ambigüidades ocorrem quando um eleitor alega estar registrado, mas nenhum registro correspondente ao seu endereço atual pode ser encontrado no arquivo do eleitor. A falta de registro de correspondência não é prova de que a pessoa não está cadastrada. Em algumas localidades, os eleitores que se mudaram podem votar, desde que não tenham mudado de distrito eleitoral. Outros podem optar por votar na antiga delegacia, utilizando o cadastro anexado ao endereço anterior. Os estudantes universitários podem votar em alguns estados onde frequentam a escola, mas isso pode não refletir seu endereço permanente.

Outra possibilidade de os eleitores que relatam estar registrados não terem um registro correspondente é que o entrevistado não conseguiu fazer a correspondência com o arquivo do eleitor comercial. Isso pode ser devido a erros no arquivo do eleitor ou nos dados de identificação pessoal fornecidos pelo entrevistado, impedindo que um registro válido de outra forma seja encontrado. À luz dessas possibilidades, deve-se ter cuidado ao avaliar o status de registro de respondentes aparentemente não registrados.

Erro de pesquisa no registro relatado

A natureza problemática de medir o registro de eleitores é evidente na incompatibilidade entre os dados do arquivo eleitoral e as respostas dos participantes do Painel de Tendências Americanas. Os membros do painel são questionados periodicamente sobre seu status de registro usando a pergunta de três categorias descrita anteriormente no relatório. As respostas da pesquisa sobre o registro foram comparadas com o status do registro dos arquivos eleitorais. Para o propósito desta análise, devido à natureza complicada do registro eleitoral conforme discutido acima, os respondentes da pesquisa com correspondências possivelmente incorretas foram marcados como não registrados, a menos que um registro de registro válido fosse localizado em pelo menos um outro arquivo.

Um registro de registro foi localizado em pelo menos um arquivo de eleitor correspondente para 89% dos painelistas que expressaram certeza de que estão registrados. Metade (50%) daqueles que não tinham certeza sobre seu status (e que são considerados não registrados em nosso protocolo de pesquisa normal) tinham um registro de registro em pelo menos um arquivo. Mesmo 34% dos que disseram não estar cadastrados tinham cadastro em pelo menos um dos arquivos.

Como alguns registros oficiais podem estar desatualizados, a medida da pesquisa pode não ser tão problemática quanto aparece aqui. Por exemplo, alguém que se mudou pode ter um registro de registro válido em um endereço anterior - talvez a fonte da correspondência do arquivo eleitoral - mas não ter certeza se está registrado em seu endereço atual. Mas está claro que o status do registro é um conceito mais obscuro para capturar em uma pesquisa.

O partidarismo modelado é correto para a maioria dos casos

Existem tradicionalmente dois tipos de classificações de partidarismo disponíveis nos arquivos eleitorais. O primeiro é o registro do partido. No entanto, como isso não está disponível em todos os estados, os fornecedores de arquivos eleitorais tentam modelar o partidarismo com base em dados demográficos, participação eleitoral e outros fatores. Embora cada um desses modelos seja diferente, quatro fornecedores forneceram uma pontuação modelada que varia de 0 a 100, em que 0 significa mais republicano e 100 é mais democrata. Um fornecedor, entretanto, simplesmente categorizou os membros do painel por partido.

Ao todo, os arquivos que forneceram uma pontuação modelada de 0 a 100 fizeram um trabalho melhor ao classificar corretamente a afiliação partidária dos painelistas em relação ao seu partidarismo auto-relatado. Em particular, os Arquivos 1 e 2 tiveram um desempenho relativamente bom na classificação correta dos eleitores (76% e 73% classificados corretamente, respectivamente). O Arquivo 4 teve a menor participação de painelistas corretamente classificados (59%), em parte devido a uma participação superior à média classificada como independente neste modelo. Dois em cada dez membros do Painel de Tendências Americanas (20%) correspondentes ao Arquivo 4 são classificados como politicamente independentes, em comparação com apenas 3% que se identificam como não inclinados a nenhuma das partes.

Em geral, todos os arquivos foram capazes de identificar democratas em uma taxa maior do que os republicanos. Mas três fornecedores se destacaram a esse respeito. O Arquivo 1 identificou corretamente 85% dos democratas e 70% dos republicanos, enquanto o Arquivo 2 identificou corretamente 81% dos democratas e 69% dos republicanos. E embora o Arquivo 4 tivesse taxas mais baixas de identificação precisa em geral, ele também era mais capaz de identificar os democratas (68% identificados corretamente) do que os republicanos (55% corretos). O fato de a grande maioria dos negros se identificarem como democratas magros contribui para a maior taxa de acerto dos democratas do que dos republicanos.

As pontuações modeladas no comparecimento melhoram a precisão das estimativas eleitorais

O comparecimento eleitoral previsto é uma das medidas modeladas mais comumente disponíveis e amplamente utilizadas. Os fornecedores tentam modelar a probabilidade de cada pessoa votar em uma determinada eleição - seja primária, intermediária ou presidencial. Os pesquisadores usam essas informações na construção de modelos prováveis ​​de eleitores, e as campanhas as usam para alocar recursos para mobilização ou persuasão. Embora os modelos de participação sejam baseados na participação eleitoral em eleições anteriores, alguns também incluem informações demográficas e partidarismo no modelo, em uma tentativa de prever com mais precisão o comportamento eleitoral provável.

As pontuações modeladas de comparecimento são normalmente tratadas como probabilidades e oferecidas em uma escala de 0 a 100, com 0 sendo a menor probabilidade de votar em uma determinada eleição e 100 sendo a maior probabilidade de votar. (Arquivo 3 não forneceu uma probabilidade de participação.) Cada fornecedor tem seu próprio 'molho secreto' que vai para seu modelo. Como resultado, embora todos os modelos sigam uma escala semelhante de 0 a 100, cada escala tem uma média e distribuição diferentes.

Para avaliar a precisão das previsões de participação para as eleições gerais de 2016, os membros do painel correspondidos por cada fornecedor foram classificados por sua probabilidade prevista de votação em quatro grupos de tamanho igual, referidos aqui como quartis. Dentro de cada quartil, a pontuação média de participação - a média das probabilidades previstas para aquele grupo - pode ser comparada com a porcentagem do grupo que realmente votou. Se as previsões forem perfeitamente precisas, a média das probabilidades previstas e a porcentagem de votantes serão aproximadamente as mesmas.

Os fornecedores variaram um pouco na precisão de suas previsões de comparecimento. Para três dos quatro, as previsões sobre o comparecimento entre o quarto da amostra com menor probabilidade de votar tendiam a subestimar a taxa de comparecimento real. Por exemplo, a probabilidade média prevista de chegar ao quartil mais baixo no Arquivo 4 foi de apenas 27%, mas entre esse grupo 68% realmente votou. Dois outros arquivos (Arquivo 2 e Arquivo 5) também subestimaram a participação real no quartil inferior. Em contraste, a participação média prevista para o quartil mais baixo no Arquivo 1 foi de 51%, e a participação real foi quase a mesma, de 47%.onze

A maioria dos vendedores se saiu melhor com suas previsões entre os eleitores considerados com alta probabilidade de votar, embora um deles (Arquivo 4) superestimou substancialmente a participação no quartil mais alto que votaria.

Uma vez que essas pontuações podem ser usadas para preverWhoirão votar, eles também podem ser julgados por quão bem modelaram o resultado da eleição entre aqueles quefezvoto. Usando uma técnica semelhante à empregada pelos pesquisadores para criar um 'eleitorado provável' entre os entrevistados em uma pesquisa pré-eleitoral, os painelistas que responderam a uma pesquisa pós-eleitoral foram avaliados pela probabilidade pré-eleitoral de votar em 2016 ( juntamente com a ponderação usual da pesquisa sobre características demográficas e relacionadas).

Embora os eleitores autorrelatados no painel como um grupo deram a Clinton uma vantagem de 7 pontos (50% para Clinton vs. 43% para Trump), ponderar os resultados pelas pontuações de afluência esperadas de cada arquivo produziu um resultado mais próximo da eleição real resultado, que foi uma vantagem de Clinton de 2 pontos na votação nacional. Todos os arquivos chegaram perto da votação real, mostrando uma vantagem de Clinton de 3 ou 4 pontos.