Dagens ord


Ansvar väger tyngre än frihet - Responsibility trumps liberty

22 mars 2013

Korrelation och kausalitet, lite metodologi, källkritik och vetenskapsjournalistik


I tidningen ser du en artikel med rubriken "Överviktiga är sjukare".

Betyder detta att övervikt orsakar dålig hälsa?

Eftersom du är en eftertänksam person läser du artikeln noga, och ställer källkritiska frågor: Vem säger vad till vemvar, när, hur och varför? Låt oss säga att artikeln nyligen publicerades i en större dagstidning och är skriven av en (frilansande) vetenskapsjournalist. Journalisten skriver att en stor nationell studie nu bevisat det vi redan misstänkte: Övervikt orsakar ohälsa.

Artikeln baseras i sin tur på en rapport från en longitudinell studie som genomförts vid ett universitetssjukhus och som i dagarna publicerats i en (känd) vetenskaplig tidskrift. Forskarna som skrivit rapporten är välmeriterade medicinska specialister. I rapportens sammanfattning skriver de att studien med stor säkerhet visar en tydlig negativ korrelation mellan övervikt och hälsa.

Du noterar att studien inbegripit tusentals personer som följts under två decennier, och utan att lusläsa rapporten bedömer du att urval och mätmetoder, m.m., verkar rimliga (intern validitet). De beräkningar och redovisningar av korrelationens styrka och signifikans som redovisas motiverar slutsatsen att studien "med stor säkerhet visar en tydlig negativ korrelation mellan övervikt och hälsa" (reliabilitet). Du bedömer vidare att forskarnas definitioner av "övervikt" och "hälsa" är relevanta (extern validitet), och att resultaten tycks gälla för en stor del av befolkningen (generaliserbarhet).

Du jämför studiens resultat med andra, jämförbara, studier och noterar att resultaten verkar ligga i linje med majoriteten av dessa (replikerbarhet). Samtidigt funderar du lite på om det kan vara så att studier som inte uppvisat liknande resultat helt enkelt sällan publiceras eller omnämns i medierna (publication bias).

Din undersökning ger vid handen att den bakomliggande studien är gedigen och värd att ta på allvar. Du konstaterar att artikeln som ursprungligen fångade ditt intresse var formulerad på ett sätt som inte återspeglade studien på ett korrekt och ansvarsfullt sätt. För det första är artikelns rubrik alltför vag och öppen: den kan tolkas på flera olika sätt, vilka studiens definitioner och resultat inte ger grund för. För det andra har journalisten använt ordet "bevis" på ett tvivelaktigt sätt. Och för det tredje - och viktigast - studien har inte visat att övervikt orsakar ohälsa. Den har inte ens utformats för att undersöka detta.

Du tänker först att sådana här missförstånd, överdrifter och förenklingar, de får man nog räkna med: Dagstidningar måste ju sälja lösnummer och journalister måste ju förtjäna sitt levebröd. Och förresten är det väl inte rimligt att förvänta sig att läsekretsen ska vara insatta i (eller ens intresserade av) vetenskapliga spetsfundigheter?

Fast, å andra sidan, är det verkligen försvarbart att förvanska vetenskapliga studier och resultat? Du - som själv har goda förkunskaper och instinkter, och som har företagit en ganska grundlig efterforskning - kan unna dig ett betrakta det hela med en viss distans. Men alla har kanske inte möjlighet att skapa sig en sådan distans. Vad ska de tro om det de läser i tidningen? Och hur påverkas de? Är det inte precis därför att de flesta människor varken har tid eller kunskaper att ifrågasätta det tidningen skriver som överdrifter och förenklingar är så farliga?

Nu när du har idkat källkritik, tillämpat dina kunskaper om vetenskaplig metodologi, och reflekterat över journalistikens villkor, är det dags att fundera lite djupare på sambandet mellan övervikt och hälsa.

Studien visar alltså inte att övervikt orsakar ohälsa (så som dessa termer har definierats). Den visar däremot en (tydlig, stark, negativ) korrelation mellan dessa. Med andra ord: studien visar inte ett kausalt samband mellan övervikt och hälsa; vad den visar är att övervikt och ohälsa samvarierar.

Låt oss säga att vi mäter BMI* och antalet (självrapporterade) sjukdomssymtom hos ett stort antal personer. Om det visar sig att personer med högt BMI rapporterar ett stort antal symtom, medan personer med lågt BMI rapporterar ett litet antal symtom, kan vi säga att att BMI och ohälsa är korrelerade. På motsvarande sätt: om vi mäter samma personer en tid senare och upptäcker att de personer vars BMI har ökat rapporterar fler symtom än tidigare, och de personer vars BMI har minskat rapporterar färre symtom än tidigare, har vi upptäckt en samvariation mellan BMI och ohälsa.

Vad vi inte har visat är att ett ökat BMI orsakar fler sjukdomssymtom. Det kan vi, strängt taget, aldrig visa med en studie som denna - oavsett hur stark, tydlig och pålitlig samvariationen är.

Ett kausalt samband mellan två företeelser, A och B, innebär att A orsakar B. Detta betyder inte (alltid) att A med nödvändighet medför B, utan att A direkt påverkar (förekomsten av) B. Vi kan t.ex. säga att ett virus orsakar förkylning, trots att exponering för viruset inte nödvändigtvis innebär att man blir förkyld.

En korrelation mellan A och B visar endast att förekomsten av A står i proportion till förekomsten av B (under vissa omständigheter).

Det finns flera tänkbara scenarier där vi observerar en korrelation mellan A och B utan att det föreligger  ett kausalt samband. Det kan vara så att:

  • B orsakar A. Det finns alltså ett orsakssamband, men det verkar åt motsatt håll. Denna påverkan kan vara direkt eller indirekt (se nedan). I vårt fall skulle det alltså kunna vara så att sjukdom leder till ett mindre aktivt liv, vilket i sin tur leder till ökad vikt.

  • A orsakar C (som orsakar D, som orsakar E...), som i sin tur orsakar B. I sådana här fall är det ofta missvisande att säga att A orsakar B även om företeelserna är förbundna av en orsakskedja. Det skulle t.ex. kunna vara så att ökad vikt leder till sämre självförtroende, vilket leder till isolering, vilket leder till passivitet, vilket i sin tur leder till sämre hälsa. Det är alltså inte övervikt i sig som orsakar ohälsa, utan andra faktorer som (oftare) förekommer i samband med övervikt. Man bör alltså inte förvånas över att ofta träffa på överviktiga personer som är kärnfriska.

  • A och C orsakar B. Här är det alltså endast i kombination med en eller flera andra faktorer som A orsakar B. Om C är allmänt förekommande, eller okänd, kan det verka som om A ensamt orsakar B. Ett exempel på detta är magsår: Man trodde länge att magsår orsakades av stress (och dåliga matvanor). Men nyligen upptäckte man att magsår orsakas av en bakterie, som endast i kombination med andra faktorer, bl.a. stress, ger upphov till besvär. 

  • C orsakar både A och B. Det här är en vanlig situation. Vi observerar att två faktorer, A och B, samvarierar och det ligger nära till hands att tro att den ena orsakar den andra. I själva verket påverkas båda faktorerna av en eller flera bakomliggande faktorer. Sambandet är alltså illusoriskt (spurious, confounded). För att undvika den här typen av misstag måste vi vara mycket försiktiga och uppmärksamma. Vetenskapen fortskrider ofta genom att successivt klargöra den här typen av samband. Tänk dig t.ex. att du gör ett stort representativt urval av människor i din kommun. Du mäter varje persons skostorlek och låter alla göra ett standardiserat intelligenstest för att mäta IQ. När du sammanställer dina data ser du en stark positiv korrelation mellan skostorlek och IQ. Vad är det frågan om? Kan det verkligen vara så att ökad skostorlek leder till högre intelligens, eller vice versa? Nej, naturligtvis inte. I stället är den avgörande faktorn i det här fallet ålder. Barn får inte lika höga poäng som vuxna på ett IQ-test. Och barn har mindre fötter än vuxna. I båda fallen är det åldern som är avgörande.

  • Korrelationen mellan A och B är slumpmässig (tillfällig, situationsberoende). Det finns helt enkelt inget orsakssamband mellan A och B. Den globala medeltemperaturen har stigit under de senaste århundradena, i takt med att antalet pirater har minskat. Det vore emellertid orimligt att dra slutsatsen att pirater kyler ner världshaven (och att koldioxidens påverkan är försumbar).

Studien av övervikt och hälsa är främst utformad för att utesluta tillfälliga samvariationer: Om det är något vi kan säga med säkerhet så är det just att den upptäckta korrelationen verkar mycket robust. Vad har vi då för glädje av denna information? Ja, dels kan det vara så att många andra studier indikerar olika möjliga orsakssamband som tillsammans gör det troligt att övervikt är en av flera bidragande orsaker till ohälsa. Att korrelationen är så stark motiverar att vi prioriterar arbetet med att - bl.a. med riktade experimentella studier - identifiera olika orsaksamband. Det kan också vara motiverat att motverka både övervikt och ohälsa även utan ett klarlagt orsakssamband (eller riktning).

För att visa ett kausalt samband mellan två faktorer, A och B, måste vi utföra experiment där vi successivt utesluter alla ovanstående möjligheter. Så gott vi kan. Om det över huvud taget är (praktiskt, etiskt) möjligt. (Du kommer att få lära dig mer om hur man utför experiment längre fram.)


Titta på det här inslaget från SVT:s Rapport om strålbehandling och hjärtinfarkt (14 mars 2013). Fundera på hur och varför de studier som rapporteras har utförts, vad de visar, och hur olika personer i inslaget tolkar och förhåller sig till dem. Vilka outtalade antaganden och kopplingar görs?

---

Förutom alla de fallgropar och praktiska problem som vi har uppmärksammat här, står vi inför ytterligare ett dilemma när vi diskuterar orsakssamband eller kausalitet. Och det är att själva begreppet, när man tittar närmare på det, inte är så självklart som man kanske kan tro. Faktum är att filosofer och vetenskapare inte är helt överens om vad vi bör lägga in i ordet orsak, eller när vi kan säga oss vara säkra på att ha upptäckt en sådan. Kanske är de orsakssamband vi tycker oss se omkring oss illusioner, vanor, eller en konsekvens av våra hjärnors uppbyggnad?


Som en övning, leta efter tidningsartiklar med rubriker i stil med: "Längre utbildning ger längre liv". Studera vad de säger, och undersök vad de bygger på. Försök att skilja på det du tror (dig veta), det som faktiskt skrivs; vad som verkar rimligt, och vilket stöd som finns för detta.


Läs mer: Allt som är fel med dagens journalistik om vetenskap

Läs mer: Correlation is not causation

Läs mer: cum hoc non propter hoc.


Läs mer: Nutrition science is complicated

---

(*) Body Mass Index