Correlação e causalidade

Cruzamo-nos frequentemente com um grande número de informações de natureza estatística, especialmente aquelas que estão muito acessíveis a todos, através dos órgãos de comunicação social. As noções estatísticas são complexas, e é fácil e relativamente frequente observar erros de interpretação. Alguns destes surpreendem, porque são cometidos por pessoas da ciência, as que menos esperaríamos ver cometê-los. Outros têm consequências dramáticas; há exemplos terríveis de erros de interpretação de estatísticas, no campo da justiça criminal. Em outros casos, ainda, formas erradas de interpretação de resultados estatísticos são usados para manipular a opinião pública.


Um dos erros mais comuns é a confusão entre as noções de correlação e de causalidade. Correlação entre duas coisas (duas variáveis matemáticas) refere-se a quão estreitamente relacionados estão dois conjuntos de dados. Um exemplo: toma-se uma amostra de pessoas, anota-se o número diário de horas que passam diante da televisão e medem-se os seus pesos e alturas. Chega-se à conclusão que existe uma relação entre estes dados: quanto mais horas diárias as pessoas veem TV, mais obesas são. Ou seja, existe uma correlação matemática entre número de horas diante da TV e o excesso de peso.


Há contudo tendência para confundir esta correlação com uma relação causa-efeito, que é algo totalmente diferente, por simples vontade de fornecer uma explicação plausível para uma observação científica. É errado: correlação não implica causalidade! No exemplo dado, embora ver televisão e obesidade estejam correlacionados, não é correto dizer-se que o primeiro cause o segundo. Ou mesmo que o segundo cause o primeiro. A verdadeira causa da obesidade pode ser um terceiro fator que nada tem a ver com as duas “coisas” observadas (peso e horas de TV).


Um outro bom exemplo é o caso do tabaco e do cancro do pulmão. Há muitas décadas que se sabe que existe uma correlação entre o ato de fumar e a incidência de cancro. No entanto, provar que fumar causa o cancro é algo muito mais difícil de conseguir. Foram necessários estudos muito complexos com amostras enormes de pessoas para se eliminarem outros fatores que poderiam ser a verdadeira causa do elevado número de casos de cancro do pulmão verificados (por exemplo, poluição atmosférica ou métodos de diagnóstico mais apurados). Hoje, tem-se a certeza que de facto fumar causa o cancro. Uma relação causal implica um mecanismo físico que envolve uma cadeia de acontecimentos que é necessário entender.


Para terminar, uma nota de humor que demonstra o absurdo a que pode chegar por confundir uma simples correlação matemática com uma relação causal. Se desenharmos os gráficos da evolução da dívida pública da Grécia e do número de utilizadores de uma conhecida rede social, nos últimos oito anos, constatamos uma correlação quase perfeita entre estes dados. Alguém tem a tentação de dizer que o Facebook é responsável ou é a causa da crise da dívida grega?

José Paulo Matias (Centro Ciência Viva de Bragança) - 2013-07-19 12:01:25