Pedro Magalhães

Margens de Erro

Um guia para os perplexos

Posted September 28th, 2015 at 9:30 am4 Comments

"Como é possível que a coligação governamental possa chegar a estas eleições sem ser castigada eleitoralmente?"

A coligação vai ser castigada eleitoralmente. Vamos imaginar que no dia 4 tinha os 38% que o agregador do Popstar lhe dá neste momento. Presumindo que a participação eleitoral não muda muito de 2011 para 2015, isto implicaria que a coligação perderia 700.000 votos, 1 em cada 4 dos votos de 2011. Desde 1974, PSD+CDS só tiveram menos em conjunto nas eleições de 2005. Perdas acima dos 12 pontos percentuais para um governo só tivemos de 1983 para 1985 para os partidos do Bloco Central (mas isso foi no ano do PRD), de 1991 para 1995 para o PSD, e de 2002 para 2005 para a coligação PSD/CDS. Claro que, se tiver algo mais perto dos 41% que a Católica lhe atribui neste momento, as perdas serão menores. Mas mesmo assim seriam cerca de 550.000 votos, 1 em cada 5 dos de 2011.

"OK, mas mesmo assim como é possível que a coligação tenha hipótese de ganhar esta eleição, depois de quatro anos de austeridade?"

Quatro anos de austeridade sob este governo talvez seja esticar um pouco a coisa. A medida convencional de ajustamento orçamental é a mudança no défice estrutural, o défice calculado em relação ao PIB potential, retirada a componente cíclica (sei que há controvérsias mas para este efeito não fazem grande diferença). A evolução ao longo dos últimos anos na Europa do Sul foi descrita há pouco tempo num artigo da Bloomberg:

-1x-1 Primeiro, note-se que a austeridade já vinha de 2009 para 2011. Segundo, sendo certo que se acentua claramente de 2011 para 2012, desacelera de novo até 2014 e - surpresa - inverte de 2014 para 2015, segundo as previsões. O FMI anda-se a queixar há uns tempos, mas o PM já explicou que são uns grandes pessimistas.

"OK, mas isso é demasiado abstracto. As medidas tomadas inicialmente geraram mesmo assim uma espiral recessiva, não foi?"

Não, não foi. O gráfico abaixo mostra, no eixo y da direita, a taxa de desemprego (fonte). A partir de Fevereiro de 2013, o desemprego começa a descer.

polls and unemployment Do lado direito vemos as intenções de voto do conjunto PSD+CDS (até Maio) e da coligação pré-eleitoral PSD/CDS (a partir daí). Os partidos de governo perdem continuamente até Setembro de 2012, perdem ainda mais de forma súbita nesse mês (toda a gente sabe porquê), atingem o ponto mínimo em Julho de 2013 (também toda a gente sabe porquê), e a partir daí mantêm-se mais ou menos estáveis. Não deve ser um acaso.

Podemos também olhar para o crescimento do PIB (por trimestre, real, em relação ao trimestre anterior, fonte) e veremos mais ou menos o mesmo:

polls growth "OK, mas as pessoas não andam a ver dados económicos em sites do Eurostat ou do BCE. O que importa é a percepção que têm, e essa não melhorou."

Melhorou sim, pouco mas melhorou. O gráfico abaixo mostra o valor médio das respostas à pergunta "Como avalia a situação actual da economia portuguesa", numa escala de 1 (muito má) a 4 (muito boa), do Eurobarómetro. De Novembro de 2013 para Junho de 2014 subiu, e continuou a subir.

Screen Shot 2015-09-28 at 08.35.26 Vê-se o mesmo quando se olha para a resposta à pergunta "Quais são as suas expectativas para os próximos doze meses: os próximos doze meses serão melhores, piores ou iguais, no que diz respeito à situação económica em Portugal?" (fonte).

Screen Shot 2015-09-28 at 08.39.22 E vê-se também quando se olha para a confiança do consumidor (fonte):

polls consumer Em suma, a coligação sangra até Julho de 2013, mas a partir daí estanca. Na verdade, a pergunta que apetece colocar é por que razão a coligação não recuperou mais. Não sei a resposta a essa. O desemprego melhora, mas sabemos que em parte devido à criação de emprego e em parte devido à emigração e emprego precário. O crescimento foi positivo, mas modesto. As percepções da economia a a confiança do consumidor melhoraram, mas ainda estão do lado negativo. O primeiro ministro e o vice-primeiro ministro continuam extremamente impopulares (se encontrarem no país cartazes onde eles aparecem digam, sim?). A confiança no governo aumentou, mas continua a níveis muito baixos. Os pensionistas são uma parte muito importante do eleitorado do PSD, mas foram um alvo preferencial. Etc. Eu não sei a resposta, mas aqui o que importa é que a pergunta certa talvez não seja bem a que muita gente tem colocado.

"OK, mas mesmo com isto tudo, o PS chegou a ter as eleições na mão. Como é possível que esteja em risco de as perder?"

A pergunta aqui também parte de um pressuposto errado. O gráfico abaixo mostra a evolução das estimativas do agregador de sondagens no Popstar, nomeadamente de intenção de voto no PS, na coligação (ou soma PSD+CDS) e a diferença entre as duas:

margin ps O PS foi recuperando apoio ao longo da legislatura até à segunda metade de 2013. Perdeu apoio durante a luta interna pela liderança, e voltou a recuperá-lo. Mas a maior margem que o PS alguma vez teve sobre a coligação foi de 3 (três) pontos, durante breves períodos, durante as lideranças quer de Seguro quer de Costa. A última vez foi no fim de Julho de 2015. O PS nunca teve estas eleições na mão. Ou melhor: só as esteve enquanto a PSD e CDS não tinham ainda decidido ir juntos a eleições. Ou seja, vendo bem, nunca teve.

"Mas então, o que tem impedido o PS de subir?"

Não sei. Parte da resposta já teremos visto: o que impede o PS de subir será em parte o mesmo que impede a coligação de descer. Quanto ao resto, só posso oferecer um pouco de especulação informada. Em 2011, no estudo pós-eleitoral do ICS, quase dois em cada três eleitores, e metade dos que simpatizam com o PS, diziam que o PS era "muito" ou "extremamente responsável" quer pela situação da economia nessa altura quer pelo resgate. Veremos no inquérito pós-eleitoral de 2015 em que medida isto ainda é verdade, mas é possível que uma coisa destas não se desfaça facilmente. O caso britânico mostra que há momentos históricos em que se instalam "gaps" na percepção de competência económica entre partidos, que esses "gaps" demoram muito tempo a ser vencidos e que, no caso britânico, esse "gap" instalou-se com a crise económica a favor dos Conservadores e ampliou-se com os primeiros sinais de retoma em 2013. Em Portugal as sondagens não perguntam nada disto (queixas aqui), mas é possível que tenhamos algo semelhante e que isso dite um "tecto" ao crescimento do PS que seria sempre difícil de vencer.

"Os resultados da eleição ainda podem ser diferentes daquilo que as sondagens têm estado a dizer?"

Claro. Ainda só conhecemos as últimas sondagens da penúltima semana de campanha. Em 2011, o PSD teve quase 39% na eleição, quase mais 4 pontos do que lhe davam as sondagens nessa penúltima semana. O PS teve 28%, quase menos 6 pontos do que lhe davam essas sondagens. Mudanças desse calibre, num sentido ou noutro, podem ou ampliar muito a vantagem da coligação ou, pelo contrário, anulá-la. Dito isto, não me recordo de eleições legislativas desde 1991 (antes disso não vale de todo a pena olhar para sondagens) em que um partido que estivesse à frente nesta altura tivesse perdido a eleição. Mas há sempre uma primeira vez para tudo.

Esta é uma história possível sobre esta legislatura. Outros contarão outras, focadas nas personalidades e actuação dos líderes, acidentes de campanha, discurso político, cobertura dos media, etc. Eu acho isso tudo perfeitamente legítimo. Mas esta é a história que eu acho que sei contar com alguma segurança. Qual é a vossa?

by Pedro Magalhães

Falta uma semana

Posted September 27th, 2015 at 9:21 pm4 Comments

Conhecidos os resultados do tracking de hoje da Católica (41, 34, 9, 7) , eles completam um novo ciclo em que a amostra se renovou e se tornou independente da sondagem cujo trabalho de campo terminou a 22 (a última que incluímos no Popstar). Ontem isso aconteceu com a da Intercampus, e 6ª feira com a da Aximage, isto nas tracking polls. Ficou-se também a conhecer o resultado da Eurosondagem ontem.

Entramos assim na última semana da campanha. Vale a pena comparar com o que ocorreu em eleições passadas. No quadro abaixo, apresenta-se a média simples das últimas sondagens apresentadas por cada empresa até ao fim da penúltima e da última semanas de campanha, e o intervalo entre os piores e melhores resultados (não creio que as médias dêem as melhores estimativas — estas sim — mas apresento-as para fins de comparação). No caso das de 2015, só conhecemos obviamente as primeiras. Arrendondo tudo à unidade no que toca às sondagens.

Penúltima semana Nesta eleição, e nesta penúltima semana, os intervalos entre os melhores e os piores resultados para PS e para a coligação nas sondagens (5 pontos para a coligação, 3 para o PS) são amplos, mas não inéditos. Em 2005, o intervalo entre o melhor e o pior resultados para o PS foi de 4 pontos, de 5 pontos em 2009 e 4 pontos em 2011. E nessa eleição foi de 3 pontos para o CDS, uma incerteza grande tendo em conta a comparativamente pequena dimensão do partido.

Importa também notar que os resultados das sondagens da última semana trazem por vezes mudanças não irrelevantes. Em 2002, o CDS passou de 5% para 7%, acabando por ter 8.7% na eleição. Em 2011, o PSD passou de 35% para 37%, acabando por ter um resultado de 38.6%. Em direcção contrária, na mesma eleição, o PS passou de 34% para 31%, acabando com um resultado de 28.1%. É curioso que estes três casos, aqueles em que há mudanças mais relevantes nas sondagens da penúltima para a última semana, sejam também casos em que o resultado final acaba por prolongar essa tendência (de subida ou de descida).

by Pedro Magalhães

Redistribuindo indecisos na Aximage e outros assuntos

Posted September 24th, 2015 at 10:03 am4 Comments

A Aximage apresenta a distribuição das intenções de voto por partido excluindo os presumíveis ou declarados abstencionistas mas deixando no denominador os que não sabem em que partido votariam (os "indecisos"). No Popstar, temos até agora introduzido os resultados tal como a Aximage os divulga. Fizemos isso porque, do ponto dinâmico, para as nossas estimativas, isso não faz diferença, e também porque nos custa impor pressuposições que os autores das sondagens não partilham. Mas de um ponto de vista estático isto faz diferença: os resultados da Aximage, por incluírem indecisos, não são directamente comparáveis aos das outras empresas desse ponto de vista e, no geral, contribuem para baixar as estimativas de todos os partidos em cada momento.

Assim, decidimos fazer essa redistribuição desde que há sondagens para a coligação, e calcular a partir de hoje o filtro com os novos dados. O efeito em relação às estimativas anteriores é muito simples: todos sobem proporcionalmente à sua dimensão, como seria de esperar quando se redistribuem indecisos pelas opções de voto proporcionalmente (o que é equivalente a pressupor que não votam, uma pressuposição heróica, mas a única que podemos adoptar com a informação que temos). Nada muda de fundamental, mas passamos a lidar com dados comparáveis para todas as empresas. Assim, as nossas novas estimativas, com os novos intervalos de confiança:

PSD/CDS: 37,8% [32,1%, 43,5%]

PS: 36,1% [32,2%, 40%]

CDU: 9.1% [7,3%, 10,8%]

BE: 5.6% [3,7%, 7,5%]

PDR: 2.5% [1,1%, 4%]

Livre: 1,9% [0,4%, 3,3%]

Recordem que há bastante tempo que não temos informação nova sobre o PDR ou o Livre.

Outra coisa: reparem nos intervalos de confiança. São amplos, mais amplos do que se justificaria se fossem calculados apenas tendo em conta o erro amostral, especialmente aquele que decorre da agregação de várias amostras (mesmo que pequenas). E não são igualmente amplos para todos os partidos (isso seria sempre assim, mesmo que o intervalo de confiança fosse calculado apenas na base do erro amostral, mas neste caso há uma razão adicional). Na estimação usando o filtro de Kalman, não presumimos que a única fonte de erro é o erro amostral, mas estimamos também uma constante adicional para cada partido que procura captar o erro não-amostral (causado por enviesamentos na construção da amostra, erros de medição, etc). Sucede que, à excepção da CDU, como explicado ontem, este valor é estatisticamente significativo, aumentando os intervalos de confiança em relação ao que seria de esperar se estivéssemos apenas a lidar com erro aleatório.

by Pedro Magalhães

Filtrar o ruído das sondagens – republicação

Posted September 23rd, 2015 at 4:36 pm4 Comments

Republico um post antigo, de Agosto de 2013, que explica o método que usamos para estimar intenções de voto na base das sondagens que vão sendo publicadas, para esclarecer dúvidas, actualizando apenas os gráficos:

Escrito conjuntamente com Luís Aguiar-Conraria.

Analistas políticos encontram muitas vezes dificuldades em lidar com a imensa variabilidade nas sondagens. A principal dificuldade é mesmo compreender o motivo de tal variabilidade. Se hoje observarmos uma sondagem com resultados radicalmente diferentes da maioria das anteriores, deveremos interpretar essa diferença como sendo o resultado de uma forte alteração da opinião pública ou, pelo contrário, olhar para esse resultado como um mero resultado estatístico de uma sondagem que, pela sua própria natureza é sempre incerta?

Intuitivamente a resposta é simples. Se presumirmos que a opinião pública é estável ao longo do tempo, então a melhor abordagem é, simplesmente, calcular uma média das várias sondagens (eventualmente, ponderada pelo tamanho da amostra de cada uma). Se, pelo contrário, admitirmos que a opinião pública é extremamente volátil ao longo do tempo, então o melhor será olhar para os resultados da última sondagem e praticamente esquecer as anteriores.

A dificuldade em avaliar o que está descrito no parágrafo anterior é óbvia. Como separar a variabilidade da opinião pública da variabilidade das sondagens quando a única forma de medir a opinião pública é recorrendo a sondagens? Haverá forma de interpretar de forma sistemática estatisticamente rigorosa as novas informações que nos chegam diariamente? Felizmente, a resposta é sim.

No Público de hoje apresentamos a ideia geral, mas aqui damos uma explicação mais detalhada. A técnica que vamos usar, o filtro de Kalman, nasceu em 1960 na engenharia e é actualmente usada em todos os domínios científicos. O filtro de Kalman original já foi generalizado em várias direcções. Nas ciências sociais, o filtro de Kalman é bastante usado em modelos de estimação do estado latente (state-space models) — lamentamos o jargão, mas não sabemos como evitá-lo.

A ideia principal destes modelos, aplicados ao nosso caso, é considerar que há dois tipos de variáveis. Um tipo de variáveis, a que chamamos variáveis latentes, que não observamos directamente — no nosso caso a opinião pública — e um tipo de variáveis que observamos e que são uma medida imperfeita das variáveis não observadas — no nosso caso, as sondagens. O modelo a estimar reduz-se então a um sistema de duas equações. Uma equação — a que chamamos equação de transição — descreve a evolução do estado latente, ou seja da opinião pública. A outra descreve a relação entre o estado latente e a variável observada, ou seja entre a opinião pública e as sondagens.

No nosso modelo, vamos considerar que, se nada de especial acontecer, então a opinião pública não muda. Ou seja, a percentagem que apoia um dado partido hoje é igual à de ontem. Se houver algum choque externo, então a percentagem de apoiantes pode mudar. Matematicamente:

%Partidot = %Partidot-1+ ut

Em que ut representa os choques externos ou inovações, que presumimos serem gaussianos com média zero e variância σu2. Para já presuma que sabemos o valor de σu2.

A segunda equação capta relação entre as sondagens e a realidade. Aqui vamos presumir que cada sondagem é uma estimativa não enviesada da realidade que, no entanto, está sujeita a um termo de erro:

%Sondagemt= %Partidot + εt

em que εt representa o termo de erro que, mais uma vez, presumimos ser gaussiano de média zero. Neste caso, em princípio, saberíamos exactamente a variância do termo de erro: uma sondagem feita no dia t com Nt entrevistados que atribuísse ao partido uma percentagem de votos π teria variância de σ2ε,t = πt (1 – πt) / Nt.

Com excepção de σu2, todos estes dados estão disponíveis e já poderíamos processar de forma bastante eficiente a informação oferecida por cada nova sondagem. Mas, na verdade, podemos fazer um pouco melhor. Infelizmente, para explicar exactamente o que fazemos, teremos de recorrer a uma linguagem mais técnica.

Em primeiro lugar, podemos aproveitar o facto de podermos facilmente generalizar o modelo para analisar várias variáveis em simultâneo. Pelo que podemos considerar um vector com as intenções de voto de todos os partidos, bem como considerar simultaneamente as sondagens para os cinco partidos com representação parlamentar, podendo ainda considerar um sexto “partido” chamado OBN (Outros, Brancos e Nulos).

Tudo se resume ao seguinte modelo a estimar por máxima verosimilhança:

yt = zt + νt , νt ~ N(0,Σν,t)

zt = zt-1 ωt , ωt ~ N(0,Σω)

em que Yt é um vector com as sondagens para os seis partidos sob análise (PS, PSD, BE, CDS, CDU e OBN), Zt é um vector com o valor latente de cada um dos partidos, νt é o vector com os termos de erro associados às sondagens e ωt o vector com as inovações que afectam cada um dos partidos.

Note-se que as únicas variáveis observáveis são as sondagens (Yt). Todas as outras são estimadas. A matriz de variâncias e covariâncias associadas aos erros das sondagens é dada por Σν,t e, como o subscrito indica, varia de sondagem para sondagem. Na diagonal principal, temos as variâncias, cujo valor teórico será yi,t (1 – yi,t) / Nt, para i = PS, PSD, BE, CDS-PP, CDU e OBN. As covariâncias teóricas também são conhecidas: (–yi,t yj,t ) / Nt.

Infelizmente, a variância do erro amostral será maior do que yi,t (1 – yi,t) / Nt. Este valor para a variância é um valor teórico mínimo que só seria possível se as sondagens fossem feitas com um rigor impossível de garantir, não sofrendo de nenhum dos problemas de que as sondagens tipicamente padecem (erros de cobertura da amostra, erros de medição, etc.). Assim, ao estimarmos o modelo consideraremos que a variância dos termos de erro será igual a σ2ν,t= yi,t(1 – yi,t)/Nt + αi , em que αi será uma constante não negativa a estimar. Vale a pena referir que os vários αi’s estimados são estatisticamente bastante significativos, com excepção do associado à CDU. Tal indica que o erro não-amostral é muito importante e que poderá ainda haver margem para as empresas de sondagem melhorarem nos seus métodos de amostragem e de inquirição, mesmo tendo em conta as limitações de tempo e de recursos que este tipo de trabalho impõe.

O mesmo exercício foi feito para as covariâncias. No entanto, as constantes acrescentadas às 15 diferentes covariâncias teóricas deram quase todas estatisticamente não significativas, pelo que por uma questão de parcimónia, resolvemos excluí-las do modelo. Também não incluímos no modelo variáveis que permitissem considerar os chamados house effects, o que implica que todas as casas de sondagens são tratadas da mesma forma. É algo que poderemos mudar no futuro, mas para já consideramos ser a melhor opção, especialmente à luz de trabalhos anteriores. O pressuposto de que as variáveis latentes seguem um passeio aleatório também poderia ser relaxado para, por exemplo, um processo auto-regressivo mais geral, mas a verdade é que a literatura demonstra que os ganhos com tal modelização são mínimos.

A nossa modelização é diária. Isto quer dizer que sempre que sai uma nova sondagem, actualizamos as nossas previsões relativamente ao estado de cada um dos partidos. Consideramos que o dia da sondagem corresponde ao último dia de trabalho de campo da mesma. Naturalmente, em dias em que não se revelam novas sondagens, não há novas informações pelo que a estimativa não se altera. No entanto, o intervalo de confiança em torno da estimativa aumenta dado que com o decorrer do tempo aumenta a incerteza a ela associada. Desta forma, em cada momento do tempo apresentamos a melhor estimativa possível (bem como o seu intervalo de confiança) dada a informação disponível até ao momento.

Os gráficos abaixo resultam da estimação do modelo referido com base em todas as sondagens publicadas desde as últimas eleições legislativas:

Screen Shot 2015-09-23 at 16.30.08 Screen Shot 2015-09-23 at 16.31.00 Nunca é demais realçar que o que estamos a fazer mais não é do que um método tecnicamente sofisticado de agregação de sondagens. Tal como uma refeição não pode ser melhor do que os ingredientes que a compõem, as nossas previsões só podem ser exactas na exacta medida em que as sondagens nos dêem uma fotografia não enviesada da realidade. Contudo, esperamos contribuir para que, de cada vez que sai uma sondagem, possamos olhar para ela não como um ilusório retrato definitivo da opinião pública, mas sim como uma (importante) fonte de informação que ajuda a compor um retrato mais geral e mais completo da opinião pública num determinado momento.

by Pedro Magalhães

Actualização

Posted September 23rd, 2015 at 12:28 am4 Comments

Mais duas sondagens divulgadas ontem à noite, dia 22: Intercampus e Católica. Tomamo-las em conta no Popstar, apesar de serem parte de tracking polls, porque:

1. A da Intercampus é um boost em relação à sondagem divulgada anteriormente. O que fizemos foi retirar a sondagem divulgada anteriormente e substituí-la pela divulgada ontem à noite.

2. A da Católica, se não erramos, completou agora um ciclo de renovação da amostra. Por outras palavras, a amostra na base de qual se apresentam os resultados divulgados ontem à noite é completamente diferente daquela que foi utilizada na 1º sondagem da tracking da Católica.

Estimativas actualizadas do POPSTAR:

PSD/CDS: 37,3%

PS: 35,6%

CDU: 9%

BE: 5,5%

Coligação sobe, PS desce, CDU com a mesma estimativa que tinha em Janeiro (mas abaixo dos resultados que teve durante quase dois anos, 2012 e 2013) e BE com 5,5% (contra os 3,5% que tinha em Janeiro). As sondagens mais recentes não têm apresentado estimativas para Livre ou PDR. A consequência é que a nossas estimativas se mantém intactas, mas não há nova informação a entrar.

Finalmente, as sondagens da Aximage divulgadas no Correio da Manhã são parte da tracking poll deles, em que se substituem 100 por dia de uma amostra de 700. A sondagem que for divulgada no dia 25, em princípio, terá uma amostra independente da anterior, e será adicionada nessa altura.

PS: Para quem está especialmente atento: por razões que têm a ver com o funcionamento dos gráficos e nada têm a ver com as estimativas apresentadas, há uma sondagem da Eurosondagem que está a aparecer duas vezes em dois dias diferentes nos gráficos, ao passo que as da Intercampus de que falava no ponto 1 aparecem ambas. Estamos a tentar resolver. Mas isto não tem impacto nos resultados.

by Pedro Magalhães

“Empates técnicos”

Posted September 21st, 2015 at 10:16 am4 Comments

Muita gente a dizer que as sondagens gregas anunciavam um empate técnico e que, afinal, o Syriza ganha com mais de 7 pontos de vantagem. Ui, as horríveis sondagens, e em Portugal vai ser o mesmo, e etc e tal.

Não faço ideia se "vai ser o mesmo", mas convém notar que, apesar da vantagem média do Syriza nas últimas 16 sondagens pré-eleitorais realizadas na Grécia - aquelas cujo trabalho de campo terminou, o mais tardar, dia 17 - ser de 1.1 pontos percentuais, nada menos que 12 delas estimavam as intenções de voto como sendo superiores para o Syriza, uma um empate, e 3 intenções de voto superiores para a ND. Naquelas cujo trabalho de campo terminou mais tarde (dia 18), a vantagem média foi de 2 pontos percentuais e o Syriza liderava em 6 dessas 7.

A partir do momento em que isto acontece, convém começar a pensar no seguinte: o facto de uma sondagem em particular produzir estimativas de intenções de voto onde, tendo em conta os resultados e a amostra utilizada, a vantagem estimada para um partido não é estatisticamente significativa, não significa que, no conjunto das sondagens, essa vantagem não o seja. Como obviamente não sei grego não consigo analisar os relatórios de cada sondagem e perceber qual a amostra de cada uma e, especialmente, qual a sub-amostra na base da qual se calculam as intenções de voto retirando declarados abstencionistas, indecisos e não respostas. Mas noto que aquelas das quais consigo pelo menos perceber a amostra total usada, as amostras são relativamente grandes (1200, 1083, 1003, etc). Seria preciso fazer cálculos para os quais não tenho elementos suficientes, mas não é de excluir que, agregadas estas sondagens e tomada em conta a base amostral de cada uma e a do conjunto das sondagens, esta sucessão de "empates técnicos" mas quase todos a favor do Syriza não seja "empate técnico" nenhum. Ou seja, que a vantagem do Syriza no conjunto das sondagens fosse estatisticamente significativa.

É fácil de ver que em Portugal não temos isto (ainda?). Das últimas cinco sondagens divulgadas (as mais recentes), 3 colocam a coligação à frente mas 2 colocam o PS à frente. É certo que duas delas dão vantagens à coligação na ordem dos 6-7 pontos (Aximage no início de Setembro e Católica mais recentemente), e isso está a reflectir-se nas estimativas do Popstar (que passaram a colocar, precisamente, a coligação à frente). Mas já vimos que, por enquanto, as amostras usadas em várias destas sondagens são relativamente pequenas, especialmente na comparação com o que vimos na Grécia nas sondagens realizadas na recta final da campanha (e em Portugal veremos certamente algo semelhante). E por tudo isto, as estimativas do Popstar, que calculam o intervalo de confiança das estimativas, mostram que esses intervalos estão (ainda?) sobrepostos.

O Syriza acabou por ter uma vantagem maior do que o conjunto das sondagens realizadas até dia 18 lhe davam? Sim. Porque houve eleitores que se decidiram à última hora no seu sentido? Porque houve eleitores ND que declararam uma intenção mas tenderam a abster-se mais do que os outros? Porque houve eleitores que ocultaram o seu sentido de voto quando inquiridos? Porque houve um enviesamento comum na construção das amostras que levou a subestimar o eleitorado do Syriza e sobrestimar o eleitorado da ND? Tudo isso é possível, mas o que perturba nas eleições gregas não é tanto as sondagens pré-eleitorais: é a sondagem à boca das urnas, a exit poll. Porque aí podemos excluir as explicações ligadas a "intenções" e, mesmo assim, estas subestimação do Syriza e sobrestimação da ND verificaram-se na mesma: a vantagem estimada foi de 4.1 mas acabou por ser maior, e os resultados ficaram fora dos intervalos anunciados para cada um dos partidos.

Em suma: cuidado com o conceito de "empate técnico".

by Pedro Magalhães

A duas semanas

Posted September 19th, 2015 at 10:15 am4 Comments

1. PS e coligação PSD/CDS estão empatados nas sondagens. Já sei, já sei, a Católica dá 7 pontos de vantagem à coligação. Mas recordem-se que na semana passada a Aximage dava quase seis, ficou tudo doido, e depois na sondagem de ontem essa vantagem ficou reduzida a pouco mais de 1 ponto. Calma. Não vale a pena andarmos a discutir sondagem a sondagem, especialmente se tiverem amostras pequenas de inquiridos a dar a sua inclinação de voto, como algumas das mais recentes. O retrato de conjunto é que conta, e esse está num agregador como o Popstar: PSD/CDS, 36,2%; PS, 35,8%. A diferença, mesmo agregando várias sondagens (e assim aumentando a base amostral implícita), não é significativa.

Screen Shot 2015-09-19 at 09.42.53 2. A outra parte da história que estas estimativas do Popstar nos contam é que o PS tem estado a descer desde o início de Julho. Nessa altura, as intenções de voto no PS podiam ser estimadas em 37,5%. Foi o máximo histórico na legislatura. Nunca mais voltou a esse nível.

3. Que a coligação esteja a subir é menos evidente. Ao contrário do que sucede com o PS, os resultados da coligação estão muito dispersos, mais altos para a Aximage e a Católica, mais baixos para a Eurosondagem e para a Intercampus.

Screen Shot 2015-09-19 at 09.57.27 4. Se o PS está a descer e a coligação está estável, quem está a subir? Desde meados de Junho, é o Bloco de Esquerda, de mínimos históricos na legislatura de 4% para os actuais 5,4% na estimativa do Popstar. É verdade que isto é pouco mais do que os 5,2% que o BE teve em 2011, mas é sem dúvida um sinal positivo para o partido. A CDU está estável. Sobre PDR e Livre, começa a ser difícil falar, dado que não aparecem individualizados nas em duas das sondagens mais recentes. Não é bom sinal para eles.

Screen Shot 2015-09-19 at 10.03.35 .

by Pedro Magalhães

Negatividade no Twitter sobre Costa, Passos e Catarina Martins

Posted September 17th, 2015 at 4:26 pm4 Comments

No gráfico abaixo, vemos a evolução (amaciada) do rácio entre o número de menções diárias no Twitter que o Popstar classificou como positivas feitas a Costa, Passos e Catarina Martins e aquelas que classificou como negativas. Convém notar que isto é o logaritmo do rácio, tendo em conta que as menções negativas são muito (mas mesmo muito) mais prevalecentes que as positivas. Mas digamos que valores superiores correspondem a "menos negatividade", valores inferiores a "mais negatividade".

Screen Shot 2015-09-17 at 16.24.29 Se olharmos para as últimas semanas, vemos que, até ao início de Agosto, Costa objecto de menor negatividade que Passos. Mas no início de Agosto, isso muda. Surpreendidos? E só muito recentemente a tendência se inverte. Entretanto, Catarina Martins em subida desde meados de Agosto. Infelizmente, não temos sondagens suficientes para medir a opinião pública com esta granularidade, e não convêm tirar excessivas conclusões. Mas parece-me pelo menos curiosa a coincidência entre estas tendências e, creio, o senso comum. Talvez o teste do algodão seja ver o que sucede depois do debate de hoje...

by Pedro Magalhães

Costa v. Jerónimo

Posted September 17th, 2015 at 12:28 pm4 Comments

António Costa e Jerónimo de Sousa debateram ontem. Em consequência, no Twitter, no dia de ontem, um pico para Jerónimo, identificado pelo Popstar como target de tweets 131 vezes. Costa 358 vezes. Recordo que estas são as menções durante todo o dia, nem todas terão a ver com o debate, mas mesmo assim notam-se as consequências para o "buzz" em torno do dirigente comunista.

Screen Shot 2015-09-17 at 12.19.31 96 menções classificadas como negativas para Jerónimo, 73% do total. 235 negativas para Costa, 65% do total. A minha hipótese é que os apoiantes dos partidos da coligação não terão prestado muita atenção a Costa ontem. Caso contrário, seria de esperar uma negatividade bem maior e próxima do habitual.

by Pedro Magalhães

Passos v. Costa no Twitter

Posted September 15th, 2015 at 6:15 pm4 Comments

O debate entre Passos Coelho e António Costa rebentou com o Twitter. No dia 9 de Setembro, o Popstar captou um total de 9821 menções a um ou a outro na twittosfera portuguesa. No dia seguinte, o número de menções foi muito inferior (1677 no total): Screen Shot 2015-09-15 at 17.20.56 Nas notícias online e nos blogues há picos semelhantes, se bem que com valores absolutos obviamente muito inferiores: Screen Shot 2015-09-15 at 17.24.22 Screen Shot 2015-09-15 at 17.25.17 Qual o sentimento expresso na twittosfera sobre os dois líderes políticos nesses dias? O Popstar treinou uma ferramenta de análise de sentimento no Twitter para medir a polaridade das menções no Twitter, distinguindo entre negativas, neutras e positivas. O gráfico seguinte mostra, para os dias 9 e 10, a proporção de menções codificadas como negativas para cada líder partidário: Tweets negativos Conclusões? A primeira é que a esmagadora maioria das menções são classificadas como negativas pela nossa ferramenta, seja porque as menções aos líderes nos tweets co-ocorrem com palavras (na base deste léxico), expressões, emoticons, ou linguagem informal com polaridade negativa, seja porque o vocabulário utilizado tem alta probabilidade de estar associado a mensagens que codificadores humanos anteriormente classificaram como negativas. A segunda é que, apesar disso, essa proporção diminuiu fora "do calor da batalha", com um aumento de menções neutras. A terceira é que as diferenças entre os dois líderes partidários são muito pequenas, com ligeira (des)vantagem para Passos Coelho em termos de proporção de menções negativas. Não me parece avisado retirar daqui qualquer conclusão para além desta pura descrição dos dados. São o que são, com as suas limitações. O retrato geral, contudo, é de uma twittosfera política usada predominante como arma de crítica política, especialmente em cima do acontecimento. Nada de muito surpreendente, mas é interessante vê-lo quantificado.

Já agora, se formos ver o que se passou com Catarina Martins e os seus interlocutores nos dias em que debateu, vemos um fenómeno interessante. Catarina Martins é sempre "target" de menos tweets nesses dias do que aqueles com quem debateu (uma desproporção que se torna brutal no caso do debate com Portas, 290 v. 1229), mas também de menos tweets negativos e até de bastantes menções que a ferramenta classifica como positivas. catarina

by Pedro Magalhães