Lar Bases de dados Usando algoritmos para prever eleições: um bate-papo com drew linzer

Usando algoritmos para prever eleições: um bate-papo com drew linzer

Anonim

Drew se apresentará na Big Data Innovation Summit, de 30 a 31 de janeiro em Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, ao lado de palestrantes de Obama para a América, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs e muitos mais.


Link para inscrição: http://bit.ly/Zs3wms


Esta entrevista foi conduzida por George Hill e publicada na Big Data Innovation Magazine.


Que tipo de reação houve com suas previsões?


A maior parte da reação se concentrou na diferença de precisão entre aqueles que estudaram as pesquisas de opinião pública e nas previsões de "pressentimento" de especialistas e comentaristas populares. No dia da eleição, analistas de dados como eu, Nate Silver (blog FiveThirtyEight do New York Times), Simon Jackman (Universidade de Stanford e Huffington Post) e Sam Wang (consórcio eleitoral de Princeton) colocaram as chances de reeleição de Obama em mais de 90% e previram corretamente 332 votos eleitorais para Obama como o resultado mais provável. Enquanto isso, especialistas como Karl Rove, George Will e Steve Forbes disseram que Romney venceria - e, em alguns casos, facilmente. Isso levou a falar de uma "vitória para os quantos", que espero levar a futuras eleições.


Como você avalia o algoritmo usado em suas previsões?


Meu modelo de previsão estimou os resultados da votação do estado e a votação eleitoral final, todos os dias da campanha, a partir de junho. Queria que a avaliação dessas previsões fosse o mais justa e objetiva possível - e não me deixasse nenhum espaço de manobra se estivesse errada. Assim, cerca de um mês antes da eleição, publiquei no meu site um conjunto de oito critérios de avaliação que usaria quando os resultados fossem conhecidos. Como se viu, o modelo funcionou perfeitamente. Previu durante o verão que Obama venceria todos os seus estados de 2008 menos Indiana e Carolina do Norte, e mal se mexeu nessa previsão mesmo depois que o apoio a Obama subiu em setembro, depois caiu após o primeiro debate presidencial.


A quantidade de dados usados ​​ao longo desta campanha por analistas independentes e equipes de campanha foi enorme, que tipo de implicações isso tem para o uso de dados em 2016?


A campanha de 2012 provou que várias fontes diversas de informações quantitativas podiam ser gerenciadas, confiáveis ​​e aplicadas com sucesso a vários fins. Nós, estrangeiros, fomos capazes de prever o resultado da eleição com bastante antecedência. Dentro das campanhas, houve enormes avanços no direcionamento dos eleitores, acompanhamento de opiniões, captação de recursos e participação de eleitores. Agora que sabemos que esses métodos podem funcionar, acho que não há como voltar atrás. Espero que repórteres e comentaristas de campanha levem muito mais a sério a agregação de pesquisas em 2016. E embora Obama e os democratas pareçam ter uma vantagem na tecnologia de campanha, eu ficaria surpreso se os republicanos não alcançassem rapidamente.


Você acha que o sucesso dessa campanha orientada a dados fez com que os gerentes de campanha agora precisem ser analistas e estrategistas?


Os gerentes de campanha podem não precisar ser analistas, mas devem ter uma apreciação maior de como os dados e a tecnologia podem ser aproveitados. As campanhas sempre usaram pesquisas para formular estratégias e medir o sentimento dos eleitores. Mas agora existem várias outras ferramentas poderosas disponíveis: sites de redes sociais, bancos de dados de eleitores, smartphones para celular e email marketing, para citar apenas alguns. E isso é um acréscimo aos recentes avanços nas metodologias de pesquisa e na modelagem de opinião estatística. Há muita inovação acontecendo na política de campanhas americanas no momento.


Você conseguiu prever os resultados das eleições seis meses antes, qual você acha que é o prazo máximo realista para prever com precisão um resultado usando suas técnicas de análise?


Cerca de quatro ou cinco meses são tão antigos quanto a ciência nos permite ir agora; e isso é empurrar um pouco. Antes disso, as pesquisas simplesmente não eram suficientemente informativas sobre o resultado final: muitas pessoas estão indecisas ou não começaram a prestar atenção à campanha. Os fatores econômicos e políticos históricos que demonstraram correlação com os resultados das eleições também começam a perder seu poder preditivo quando ultrapassamos o intervalo de aproximadamente 4-5 meses. Felizmente, isso ainda dá tempo às campanhas para traçar a estratégia e tomar decisões sobre como alocar seus recursos.

Usando algoritmos para prever eleições: um bate-papo com drew linzer