Pedro Magalhães

Margens de Erro

O conjunto das sondagens (1)

Posted June 5th, 2009 at 10:04 am4 Comments

Tenho apenas conhecimento de quatro últimas sondagens. Vamos olhar para elas:



Duas telefónicas, duas presenciais com simulação de voto em urna. Uma com amostragem por quotas (Marktest), três com amostragem estratificada aleatória, sendo que duas delas (CESOP e Marktest) fazem ponderação pós-amostral com base em dados das estatísticas nacionais. Três tratam indecisos como abstencionistas, outra usa um modelo próprio (Aximage). Apesar de tudo, uma razoável diversidade de abordagens.

Questões concretas:
1. Quem estava à frente no momento em que foi feito o trabalho de campo? A única sondagem que "diz" saber a resposta a essa pergunta com elevado grau de confiança é a Eurosondagem. A sua resposta é "o PS". Como vemos no quadro abaixo, tendo em conta a dimensão da amostra, a diferença de 4,1 pontos nessa sondagem é estatísticamente significativa. As restantes três sondagens não sabem a resposta a essa pergunta. Nem mesmo a Aximage, apesar de dar 5,3 pontos de vantagem ao PS. É o preço a pagar por uma amostra reduzida (mas pode ser um preço compensador se isso resultar de uma boa exclusão de não-votantes; com mais de 60% de não-votantes na Aximage, isso pode ser o caso).



2. Quem estava à frente no momento em que foi feito o trabalho de campo: BE ou CDU? A única sondagem que "diz" saber a resposta a essa pergunta é a do CESOP. "CDU", é a resposta. Para todas as outras, as diferenças num sentido ou noutro não têm significância estatística.

3. Qual era o quinto partido no momento em que foi feito o trabalho de campo? Pelo menos, aqui há consenso: o CDS-PP.

Tudo o que está acima presume que as amostras são genuinamente probabilisticas e que não há fontes de erro para além do erro amostral. Não é verdade. Mas é o que temos.

by Pedro Magalhães

Europeias. Eurosondagem, 1-2 Junho, N= 2033, simulação em urna.

Posted June 5th, 2009 at 9:48 am4 Comments

PS: 36,0%
PSD: 31,9%
BE: 10,1%
CDU: 9,0%
CDS-PP: 6,1%
OBN: 6,9%

A amostra é de 2033. Desses, 16,4% estavam indecisos, pelo que as percentagens acima são calculadas em relação a um total de, no máximo, 1700 inquiridos. Não se fala na notícia do Expresso em abstencionistas, pelo que teremos de os presumir ausentes da amostra.

by Pedro Magalhães

Europeias. Aximage, 1-4 Junho, N=1274, Tel.

Posted June 4th, 2009 at 8:53 pm4 Comments

PS: 36,2%
PSD: 30,9%
BE: 10,2%
CDU: 10,1%
CDS-PP: 5,0%


Não sei se é resultado antes ou depois de redistribuição de indecisos. Sei apenas que a soma disto dá 92,4%. É provavelmente mais sensato esperar pelo Correio da Manhã de amanhã antes de tirar mais conclusões sobre esta sondagem.

Actualização (5 de Junho):
1. OBN é mesmo 7,6%. Estas percentagens já excluem indecisos e não respostas. Segundo o CM, a distribuição dos indecisos "foi realizada a partir de um modelo que combina perguntas sobre o tipo de indecisão (abstenção/voto em quem), voto anterior, dinâmica de vitória e simpatia pelos principais candidatos". Interessante.
2. A amostra é de 1274 inquiridos. 65,3% disseram que não iriam votar. Sobram 442. Alguns deles terão dito que estão indecisos, pelo que as percentagens acima terão como base um valor inferior a 442. Mas a julgar pelas anteriores sondagens da Aximage, esse valor não há de ser muito inferior. Vamos considerar 442.

by Pedro Magalhães

Europeias. CESOP, 30 Maio-2 Junho, N=3375, simulação voto urna.

Posted June 4th, 2009 at 6:16 pm4 Comments

PS: 34%
PSD: 32%
CDU: 11%
BE: 9%
CDS-PP: 4%
MEP: 2%
PCTP-MRPP: 1%
Outros: 3%
Brancos e nulos: 4%

Esta estimativa tem como base as intenções de voto dos inquiridos que afirmaram "ter a certeza" que irão votar e que forneceram intenções de voto válidas, em branco ou nulo: foram 1584. Podem descarregar mais detalhes aqui.

by Pedro Magalhães

Outlier: "credibilidade"

Posted June 4th, 2009 at 3:51 pm4 Comments

Para o TVI24, eu ponho "em causa a credibilidade dos números do INE".

by Pedro Magalhães

O que aí vem.

Posted June 4th, 2009 at 12:34 pm4 Comments

Os quadros seguintes mostram o template que vou usar para analisar cada sondagem.

Um primeiro quadro dá alguma informação geral, mostra as estimativas de resultados eleitorais e o intervalo de confiança a 95% (aproximação à normal) associado a cada estimativa, na base da dimensão da sub-amostra de inquiridos que exprimiram uma intenção de voto, mesmo que seja em branco ou nulo. Um segundo quadro mostra diferenças entre partidos na sondagem, assim como a margem de erro da diferença. Quando a diferença na amostra é inferior à margem de erro, isso significa que essa diferença carece de significância estatística a 95%, e assinalo isso a vermelho. Quando a diferença na amostra é superior, isso significa que a diferença é estatisticamente significativa a 95%, e assinalo isso a verde. Respeitarei a opção de cada instituto de apresentar resultados com ou sem casas decimais. Tudo isto pressupõe, claro, amostragem probabilística, que sabemos ser uma pressuposição inválida. Mas enfim.

Comecemos então pela Marktest. Desde logo, a dimensão da sub-amostra de intenções válidas não se pode calcular na base das notícias saídas até ao momento. Por isso, para já, irei presumir que a percentagem de abstencionistas declarados, indecisos e não respostas é igual à do estudo anterior, o que resulta numa sub-amostra de 383.





O que nos dizem estes quadros:

1. Estritamente na base da sondagem Marktest, não é possível dizer, com um elevado grau de confiança, se a vantagem do PSD sobre o PS na amostra correspondia, à data da sondagem, a uma vantagem real na população.
2. A mesma afirmação serve para a relação entre o BE e a CDU.
3. O mesmo já não sucede com o CDS-PP: a vantagem encontrada da CDU e do BE sobre o CDS-PP é estatisticamente significativa.

by Pedro Magalhães

Sondagens "sem validade"?

Posted June 4th, 2009 at 11:13 am4 Comments

Neste blogue, acusa-se a recente sondagem da Marktest de "não ter validade", e afirma-se que "a amostragem não foi feita de forma rigorosa e profissional". São dois os argumentos apresentados:

1. "O primeiro erro, começa pela sondagem não ter em conta a Região Autónoma dos Açores e a Região Autónoma da Madeira";

2. O facto da distribuição espacial dos inquéritos por regiões "Norte", "Centro" e "Sul" não respeitar a distribuição espacial da população portuguesa.

Vejamos. Primeiro, a ficha técnica da sondagem explica claramente que o universo sobre o qual está a fazer inferências é o da população de Portugal Continental com 18 ou mais anos. O que o post poderia tentar argumentar é que a ausência dos Açores e da Madeira fazem com que não se possa fazer inferências dos resultados do Continente para os resultados totais. Mas nem a sondagem faz essa inferência nem o autor faz esse argumento. Remete para uma questão de "erro de amostragem". Mas isto não é erro nenhum: é uma opção. E ainda por cima, se o autor do blogue tivesse alguma vez olhado para resultados eleitorais, ficaria a saber que, tendencialmente, a inclusão dos Açores e da Madeira tenderia normalmente a aumentar a vantagem do PSD, não a diminuí-la.

A segunda crítica é ainda menos fundamentada:

1. O autor fala da distribuição da população, quando o que mais se aproxima do universo de interesse é a população com 18 ou mais anos.
2. Apresenta dados para Norte, Centro e Sul, divisão que não coincide com as unidades territoriais do INE;
3. Compara esses dados com a distribuição territorial do inquérito da Marktest, sem ter apurado se as categorias que usa coincidem com as da Marktest.

by Pedro Magalhães

Deputados

Posted June 4th, 2009 at 12:42 am4 Comments

Um calculador em Javascript muito jeitoso para os deputados pode ser encontrado aqui. Em vez de votos ponham percentagens. Se tiver casas decimais, multipliquem por 10.

by Pedro Magalhães

Europeias. Marktest, 27-30 Maio, N=807, Tel.

Posted June 4th, 2009 at 12:24 am4 Comments

PSD: 32,5%
PS: 29,4%
BE: 8,9%
CDU: 8,9%
CDS-PP: 3,3%

É o que sei para já, na base desta notícia. Excitante, não? Claro que voltamos ao "empate técnico", ideia que, volto a dizer, é preciso confirmar quando soubermos a dimensão real da sub-amostra na base da qual estas percentagens são estimadas (ainda não sei qual é, mas não é 807, certamente). Mas é a primeira sondagem que coloca o PSD à frente, e isso pode não ser irrelevante, porque pode sugerir uma tendência. Mas com mais dados poderemos olhar melhor para isso. Agora ainda é cedo.

Sei que sou fastidioso, mas recordo, a propósito de uma notícia no Público: se de facto o PSD subiu nos últimos dias, isto não "confirma uma tendência" prévia (indetectável na base dos dados anteriores). E a habitual frase "Se as eleições europeias fossem hoje o [partido x] venceria o escrutínio" está mesmo a pedir inclusão no capítulo no Livro de Estilo do Público intitulado "Frases que constituem justa causa para despedimento".

A soma dá 83%, pelo que presumo que haja 17% de votos noutros partidos, brancos e nulos. Mas rectificarei caso se verifique não ser assim. Obrigado ao leitor que me avisou em comentário no post abaixo.

by Pedro Magalhães

Meios de campanha

Posted June 3rd, 2009 at 12:42 pm4 Comments

E já agora, repost de outro tweet da manhã:

"Para mim, que estou muito longe destas realidades, esta peça do Público sobre os meios de campanha é impressionante: http://tcp3.com/j1kz"

by Pedro Magalhães