Pedro Magalhães

Margens de Erro

Popularidade líderes políticos (Portugal)

Posted October 18th, 2006 at 11:14 am4 Comments

Os dados mais recentes sobre os níveis de aprovação pública de Sócrates, Cavaco Silva e Marques Mendes são tão aborrecidos e trazem tão poucas mudanças em relação ao passado recente que, perdoem-me, nem os analiso. Podem ir vê-los aqui e aqui. Volto ao assunto quando houver novidades.

O que, já que falamos no assunto, pode nem tardar muito, com ministros e secretários de estado a dizerem coisas como esta, esta ou esta. Aposto que o PM não está a achar graça nenhuma à brincadeira.

P.S.- O Bloguítica já tinha opinado que se trata de um problema viral e adiciona o outro caso óbvio. Mas a leitura disto sugere que, neste caso concreto, a doença é provavelmente genética.

by Pedro Magalhães

2º turno, Brasil

Posted October 17th, 2006 at 12:27 pm4 Comments

Resultados muito aproximados, quer em intenções directas de voto quer em votos válidos, para as quatro sondagens já realizadas depois da 1ª volta das eleições:



Segundo a pesquisa IBOPE, "a grande maioria (82%) dos eleitores afirma que seu voto já está definitivo, sendo 88% entre os eleitores de Lula e 85% entre os de Geraldo Alckmin."

by Pedro Magalhães

655.000 (3)

Posted October 17th, 2006 at 12:04 pm4 Comments

Mais críticas ao estudo da Lancet, desta vez dos responsáveis do projecto Iraq Body Count (via Insurgente). Texto integral aqui. Alguns destaques:

1. O desfasamento em relação à cobertura dos meios de comunicação social:
If we consider the Lancet's June 2005 – June 2006 period, whose violent toll it estimates at 330,000, then daily estimates become lower but would still require 768 unrecorded violent deaths for every 67 that are recorded. The IBC database shows that the average number of people killed in any one violent attack is five. Therefore it would require about 150 unreported, average-size, violent assaults per day to account for 768 deaths. It is unlikely that incidents of this scale would be so consistently missed by the various media in Iraq. Although IBC technically requires only two sources for every corroborated death in its database, we actually collect, archive and analyse every unique report we can find about each incident before it is added to our database. For larger incidents the number of reports can run into the dozens, including news published in English in the original and others, mostly the Iraqi press, published in translation. In IBC's news archive for August 2006 the average-size attack leaving 5 civilians killed has a median number of 6 reports on it.

2. O desfasamento em relação ao número conhecido de feridos:
If 600,000 people have died violent deaths, then the 3:1 ratio implies that 1,800,000 Iraqis have by now been wounded. This would correspond to 1 in every 15 Iraqis.

3. A falta de credibilidade "face value" da taxa de mortalidade entre adultos masculinos
Of the 287 violent post-invasion deaths recorded by the Lancet authors where the age and sex was known, 235 (82%) were adult males between 15 and 59 years old. Extrapolating to the population as a whole would mean that around 470,000 men in this age group have been killed violently, i.e. one in 15 (7%) of adult males aged 15 to 59.

4. O desfasamento entre as certidões de óbito emitidas e as recebidas
If the Lancet estimate is correct then it follows that either (a) 500,000 documented violent deaths, for which certificates were issued, have somehow managed to completely disappear without a trace to Iraqi officials or the international media or (b) there is a vast, elaborate, and very successful, cover up of this massive number of bodies and their associated paper trail being carried out in Iraq.

5. O estranho aumento da taxa de mortalidade
Those who keenly recall the reported carnage associated with the invasion in 2003 will scarcely credit the notion that similar events but of a much greater scale and extent have continued unremarked and unrecorded, including by locals, in a nation at the level of education and urbanisation of Iraq. Iraq is not an undeveloped society where tiny, self-sufficient communities live in isolation and ignorance of each other.


O cerne da questão, segundo as pessoas da IBC:
The most likely source of such a flaw is some bias in the sampling methodology such that violent deaths were vastly over-represented in the sample. The precise potential nature of such bias is not clear at this point (it could, for example, involve problems in the application of a statistical method originally designed for studying the spread of disease in a population to direct and ongoing violence-related phenomena). But to dismiss the possibility of such bias out of hand is surely both irresponsible and unwise.

O debate continua...

by Pedro Magalhães

655.000 (2)

Posted October 16th, 2006 at 2:20 pm4 Comments

O Insurgente vem publicando vários posts onde se discute a credibilidade do estudo publicado na Lancet onde estima a mortalidade causada pela invasão do Iraque. Alguns deles são laterais , incluindo, por exemplo, cartoons, ou uma gravação vídeo onde o editor da revista de pronuncia contra a invasão. Tudo bem, que não se pode estar sempre a falar a sério.

Mas há um post muito interessante, onde se transcreve um e-mail de um "médico com algumas noções de epidemiologia", Fernando Gomes da Costa, que coloca várias dúvidas sobre o estudo. Longe de mim colocar-me na posição dos autores, que se defenderão como puderem. Mas quando a defesa já está no próprio texto do estudo, o melhor mesmo é lê-lo com atenção, como aliás eu já sugeria da primeira vez que falei no assunto. As perguntas de Fernando Gomes da Costa:

1- Foram feitos inquéritos a famílias escolhidas aleatoriamente, mas onde? também nas zonas menos tocadas pela guerra? ou só nas mais violentadas?

Segundo os autores, os clusters foram escolhidos aleatoriamente, sendo excluídos apenas três:
" On two occasions, miscommunication resulted in clusters not being visited in Muthanna and Dahuk, and instead being included in other Governorates. In Wassit, insecurity caused the team to choose the next nearest population area, in accordance with the study protocol. Later it was discovered that this second site was actually across the boundary in Baghdad Governorate."

Foi assim apenas excluído um cluster por razões potencialmente correlacionadas com as mencionadas na pergunta do e-mail, e dois outros por falta de comunicação. Consequências?

"The miscommunication that resulted in no clusters being interviewed in Duhuk and Muthanna resulted in our assuming that no excess deaths occurred in those provinces (with 5% of the population), which probably resulted in an underestimate of total deaths."


2- Os inquiridos contabilizaram (em meados de 2006) o número de familiares mortos desde os 14 meses anteriores à invasão até aos 14 seguintes. Foram mortes confirmadas por atestados em 90% dos casos dos 87% solicitados, o que dá 79% de confirmações. Temos assim que em 600.000 há portanto 126.000 casos não confirmados.

Este problema é mencionado no estudo:

"Families could have reported deaths that did not occur, although this seems unlikely, since most reported deaths could be corroborated with a certificate. However, certificates might not be issued for young children, and in some places death certificates had stopped being issued; our 92% confirmation rate was therefore deemed to be reasonable."


3- As mortes não relatadas não puderam ser, obviamente, controladas por atestados. Isto quer dizer que nada nos garante não haver uma minimização do número de mortes antes da invasão, o que poderá distorcer grandemente o método de comparação "antes e depois".

Cito do estudo:

"Our estimate of the pre-invasion crude or all-cause mortality rate is in close agreement with other sources"

Essas fontes são:

CIA 2003 Factbook entry for Iraqhttp://permanent.access.gpo.gov/lps35389/2003/iz.html(accessed Oct 2, 2006).
US Agency for International Health and US Census Bureau. Global population profile: 2002. Washington, DC: US Census Bureau, 2004:.

Podem estar também erradas, claro. Mas o fundamental é que a estimativa da mortalidade pré-invasão que resulta do inquérito coincide com resultados obtidos independentemente do inquérito.


4- Uma das mais óbvias desonestidades do “estudo” tem aliás a ver com a amostra: comparar 14 meses antes da invasão (em “paz”) com 14 meses a seguir (e portanto na fase em que houve guerra mais intensa e generalizada no terreno), e extrapolar os ditos casos desses 14 meses para os 28 meses seguintes, inflaciona, e de que maneira, os números.

Lamento, mas não há comparação com "os 14 meses a seguir". O que há é comparação da taxa de mortalidade de um período de tempo antes da invasão (14 meses) com um período de tempo posterior, a saber:

"We measured deaths from January, 2002, to July, 2006, which included the period of the 2004 survey." ~

Para além disso, a noção de que "na fase em que houve guerra mais intensa e generalizada no terreno" terá sido a fase com maior mortalidade não parece resistir aos dados:

"By mid-year 2006, 91 violent deaths had occurred in 6 months, compared with 27 post-invasion in 2003 and 77 in 2004, and 105 for 2005, suggesting that violence has escalated substantially."

A mortalidade aumentou (em vez de diminuir) após os tais "14 meses"


5- Finalmente, todos sabemos que sempre que alguém morre vítima da violência bélica no Iraque isso nos é diligentemente comunicado pela generalidade da imprensa. Seria muito fácil essa mesma imprensa (ou algum curioso) dedicar-se a pegar nos jornais desde a altura da invasão e somar as mortes (só violentas e dos iraquianos, atenção). Mas vamos supor, já atirando muito (mas muito) por alto, que desde Março de 2003 morreram em média diariamente 100 pessoas vítimas de atentados, bombas, (ou torturas dos americanos, pois claro!). Há muitos dias, como hoje, em que nada vem relatado, mas fica por conta dos outros...Teríamos assim, desde Março de 2003: 100(mortes/dia)x365(dias/ano)x3,5(3 anos e meio) = 127.750 mortes! Um bocadinho longe das 600.000...Como diz a outra: há coisas fantásticas, não há? Já agora, fazendo as contas com os números do “estudo” da Lancet: 600.000 (mortes)/(3,5x365 dias) = 469 mortes por dia, ininterruptamente desde 2003! A ser assim, e lendo a nossa imparcialíssima imprensa, até o Avante está vendido ao imperialismo americano!

Aqui não há muito a dizer: o autor do e-mail acredita na imprensa mas "não acredita" nos números. Eu também gostava de não acreditar. Mas não me parece que isso chegue.

Já agora, fica aqui um excerto do estudo onde os autores - com honestidade - listam muitos dos seus possíveis enviesamentos, alguns no sentido da sobrestimação e outros no sentido da subestimação da mortalidade:

All surveys have potential for error and bias. The extreme insecurity during this survey could have introduced bias by restricting the size of teams, the number of supervisors, and the length of time that could be prudently spent in all locations, which in turn affected the size and nature of questionnaires. Further, calling back to households not available on the initial visit was felt to be too dangerous. Families, especially in households with combatants killed, could have hidden deaths. Under-reporting of infant deaths is a wide-spread concern in surveys of this type. Entire households could have been killed, leading to a survivor bias. The population data used for cluster selection were at least 2 years old, and if populations subsequently migrated from areas of high mortality to those with low mortality, the sample might have over-represented the high-mortality areas. The miscommunication that resulted in no clusters being interviewed in Duhuk and Muthanna resulted in our assuming that no excess deaths occurred in those provinces (with 5% of the population), which probably resulted in an underestimate of total deaths. Families could have reported deaths that did not occur, although this seems unlikely, since most reported deaths could be corroborated with a certificate. However, certificates might not be issued for young children, and in some places death certificates had stopped being issued; our 92% confirmation rate was therefore deemed to be reasonable.
Large-scale migration out of Iraq could affect our death estimates by decreasing population size. Out-migration could introduce inaccuracies if such a process took place predominantly in households with either high or low violent death history. Internal population movement would be less likely to affect results appreciably. However, the number of individual households with in-migration was much the same as those with out-migration in our survey.
Although interviewers used a robust process for identifying clusters, the potential exists for interviewers to be drawn to especially affected houses through conscious or unconscious processes. Although evidence of this bias does not exist, its potential cannot be dismissed.
Furthermore, families might have misclassified information about the circumstances of death. Deaths could have been over or under-attributed to coalition forces on a consistent basis. The numbers of non-violent deaths were low, thus, estimation of trends with confidence was difficult. Not sampling two of the Governorates could have underestimated the total number of deaths, although these areas were generally known as low-violence Governorates. Finally, the sex of individuals who had died might not have been accurately reported by households. Female deaths could have been under-reported, or there might have been discomfort felt in reporting certain male deaths.

by Pedro Magalhães

2º turno

Posted October 13th, 2006 at 10:46 am4 Comments

Posso estar enganado, mas ainda só dei com duas sondagens de intenção de voto na segunda volta das presidenciais brasileiras realizadas após o 1º turno. São ambas da Datafolha (6 e 10 de Outubro). Lula surge com 50/51% de intenções directas de voto, e 54/56% de votos válidos.

A visão de longo prazo está no gráfico seguinte: 60 sondagens, realizadas desde 2005, em que o cenário Lula/Alckmin foi avançado. Descida constante de Lula até há um ano, recuperação até fim de Agosto deste ano, e declínio deste então. As percentagens são de votos válidos:

Quando olhamos para as intenções directas de voto, o mecanismo do que se passa desde fim de Agosto fica mais claro. A percentagem de votantes que afirma tencionar votar em Lula numa segunda volta não desce muito. Só que, entretanto, aqueles que se diziam abstencionistas e indecisos vão diminuindo e, pelos vistos, passando para Alckmin (clique para ampliar):



Chega para Alckmin? Isso exigiria uma de três coisas. A primeira seria uma transferência para Alckmin de alguns daqueles que dizem hoje tencionar votar Lula. Mas segundo a Datafolha, 90% dos que afirmam tencionar votar em Lula ou Alckmin dizem que a sua decisão é definitiva. Não há muito espaço para mudanças de última hora. A segunda consistiria em que todos os que agora se dizem indecisos, abstencionistas ou votos brancos e nulos passassem para Alckmin. É implausível. A terceira seria que houvesse uma excepcional desmobilização de última hora entre o eleitorado Lula. Nada disto parece muito credível. Mas esperar para ver.

by Pedro Magalhães

655.000

Posted October 12th, 2006 at 11:55 am4 Comments

Uma utilização menos usual da técnica do inquérito por questionário: um estudo publicado pela revista Lancet estima em 655.000 o número de mortos devidos à invasão no Iraque. Este "devido" deve ser concebido com significando que estas mortes estão "em excesso" em relação ao que seria previsível na base das taxas de mortalidade verificadas nos anos imediatamente anteriores. O estudo revela também que a taxa de mortalidade mais do que duplicou no período 2003-2006 em relação ao período anterior, e que parece estar a aumentar. Estima-se que cerca das 600.000 mortes tenham sido violentas.

Como se calcularam estes números? O melhor é ler. A base é um inquérito por questionário a 12.000 iraquianos. A metodologia é complexa e haverá muitos pontos para debate. Exemplo num blogue: aqui.

Entretanto, há quem recorra, como habitualmente, à fé : George W. Bush ou John Howard dizem que não "acreditam" nos números.

by Pedro Magalhães

A "queda" de Lula (2)

Posted October 4th, 2006 at 10:32 am4 Comments

Eduardo Leoni, do Brazilian Politics, chama-me à atenção por e-mail de um dado importante: Lula não "perdeu" votos. O que sucede é que não conseguiu angariar votos entre os indecisos.

Assim é, quando olhamos para as intenções directas de voto:

Lula mexe pouco, mas Alckmin sobe à medida que os indecisos descem. Eduardo Leoni levanta outro problema que decorre daqui: a pressuposição de que os indecisos se redistribuem proporcionalmente pelas opções válidas (ou, o que é a mesma coisa, que se vão todos abster) não funciona no Brasil...

by Pedro Magalhães

A "queda" de Lula

Posted October 3rd, 2006 at 2:08 pm4 Comments

Anda por aí alguma discussão sobre as razões da incapacidade de Lula ganhar à 1ª volta. A maior parte delas anda pela questão da corrupção (no Público, só para assinantes). Mas atentem no seguinte gráfico com a evolução das intenções de voto em Lula e Alckmin no IBOPE, só para usar o instituto que mais se aproximou dos resultados que Lula acabou por obter:

O que se vê é que Lula vem a descer desde finais de Agosto. O que está para a direita do dia 10 de Setembro são sondagens realizadas após a divulgação do escândalo do "dossiê Serra", e pode-se levantar a hipótese de que essa divulgação terá acelerado a descida. Mas a descida vem de antes, como já repeti aqui até à exaustão, e importa também explicá-la. Descontando o que às vezes me parece ser uma certa mania da perseguição, amplificada aqui, estou de acordo: não se deu suficiente importância a Alckmin. Lula perde votos devido a uma boa campanha do seu opositor, e não apenas devido à corrupção.

by Pedro Magalhães

Brasil: rescaldo e 2ª volta

Posted October 2nd, 2006 at 2:08 pm4 Comments

O quadro seguinte compara as últimas estimativas de cada instituto com os resultados finais. Parabéns ao Datafolha e ao Ipespe. O segundo é especialmente notável, tendo em conta a utilização de uma amostra reduzida e a inquirição telefónica. Mas pode-se também levantar a hipótese de que o Ipespe tenha tido "razão antes de tempo", ou seja, que estivesse no dia 26 a subestimar a votação em Lula, acabando por se aproximar dos resultados finais devido à tendência geral de queda de Lula que se prolongou após o dia 26. Seja como for, as diferenças entre os institutos são reduzidas, a não ser no caso Sensus. Se quiserem comparar com a performance dos institutos portugueses em 2006, podem ir aqui. Nada mau para nós, mas o Brasil é o Brasil e Portugal é Portugal...



2ª volta? O que temos são os últimos resultados de sondagens que colocavam os eleitores perante o cenário Lula/Alckmin. O score de Lula oscila entre 62% e 52%. Mas agora, vai ser difícil levar os resultados da Sensus muito a sério.

by Pedro Magalhães

Qualquer palpite é chute

Posted September 30th, 2006 at 6:48 pm4 Comments

Acaba de ser divulgada uma sondagem da Vox Populi, terminada ontem, que dá 52% de votos válidos para Lula (contra 60% na última sondagem, realizada dia 19). Mais uma que dá tendência de descida. Aguarda-se, pelo menos, uma última sondagem da Datafolha. As restantes (as mais recentes) são as seguintes:



A noite eleitoral no Domingo é capaz de acabar tarde. “O segundo turno é provável”, arrisca um especialista na análise de pesquisas. “Mas a essa altura dos acontecimentos, qualquer palpite é chute”, afirma.

P.S.- Actualização com IBOPE e Datafolha:

by Pedro Magalhães