Vikipedia’da sıkıcı gözüken bir çok makale içinde gerçekten güzel süprizler çıkabiliyor. İşte biri:

İstatistikte korelasyon hakkinda çok kullanılan ve her istatistik kullananın bilmesi gerek bir cümle şudur:

Korelasyon veya doğrusal ilişki nedensellik değildir.

Genellikle çok kişi iki değişken arasında bir ilişki kurulunca birinin sebep diğerinin sonuc olduğuna ve birinin diğerine neden olduğuna inanmış görünürler. Gerçekten nedensellik ve korelasyon birbirine bağlı kavramlardır: nedensellik ispat edilmesi için korelasyonun bulunması gereklidir ama bu nedensellik göstermek için yeterli değildir. Nedensellik ve korelasyon birbirlerine eşit değillerdir ama daha uygun cümleler ile

Empirik olarak gözümlenen birlikte değişme nedensellik açıklamasi için gereklidir ama yeterli değildir.Korelasyon nedensellik değildir; ama nedenseliğin daha ayrıntılı incelenmesi gerektiren ipucu sağlar.

İstatistikte birbiri ile çok yakından doğrusal ilişkili gibi görülen ama biri diğerine sebep-sonuç olmayan birçok pratik örnek bilinmektadir. Genellikle bu türlü nedensellikden doğmayan yakın ilişkiye sahte korelasyon adı verilmektedir. Genellikle bu sahte korelasyon iki değişkenin de bir başka saklı olan degisken tarafından etkilenmesi dolayısı ile ortaya çıkar. Biraz abstre olarak A ve B arasında bulunan yakin korelasyon daha objektif olarak dikkatle incelenince üç tür mümkün ilişki olabilceği görülür:

A nedendir B sonuçtur;B nedendir A sonuçtur;

yahut

C neden A sonuçtur VE C neden B sonuçtur.

İşte sahte korelasyon üçüncü halde ortaya çıkar. A ve B arasında görülen yakın ilişki biribirin sebep-sonuç olmasından doğmaz. Yakın korelasyon her hâlde sebep-sonuç ilişkisi ifade etmez: “korelasyon nedensellik degildir”.

Sahte korelasyon hakkında birçok örnek verilmiştir ve bunlar bazan alaycı, bazan şaşırtıcı ve bazan gülünçtür. Bunlardan bazılarını verip niçin sahte korelasyon bulunduğunu açıklayalım:

Kaynak: http://tr.wikipedia.org/wiki/Korelasyon