Dagens ord


Ansvar väger tyngre än frihet - Responsibility trumps liberty

27 jan. 2022

En uppgift om sannolikhet, statistik och vetenskap

En antologi* har 8 författare; 4 män och 4 kvinnor.

Kapitlens ordning är sådan att det första har skrivits av en kvinna, det andra av en man, det tredje av en kvinna, o.s.v. Varannan damernas, alltså.

Du tycker att det verkar vara ett märkligt sammanträffande. Är det en slump, eller kan det vara så att antologins redaktör medvetet har placerat kapitlen i denna ordning?

Du vill alltså veta hur stor sannolikheten är att kapitlen har hamnat på ett sådant sätt, om redaktören INTE har gjort ett medvetet val. Alltså, hur stor är sannolikheten att det bara råkat bli ”varannan damernas” av en slump?

Denna sannolikhet motsvarar det vi tidigare har kallat signifikans.

Om vi är forskare som undrar om det kan vara så att redaktörer har en tendens att sortera kapitlen på det här sättet så formar vi nollhypotesen:

H_0: Redaktörer har INTE en sådan tendens. Kapitlens ordning ÄR slumpmässig.

…och en forskningshypotes:

H_1: Kapitlens ordning är INTE slumpmässig (och det KAN bland annat bero på att redaktörer har en tendens, kanske helt eller delvis omedveten, att varva manliga och kvinnliga författare)

Notera att forskningshypotesen och nollhypotesen är varandras komplementhändelser. Om den ena inte är sann, så måste den andra vara det.

Notera också att utgångspunkten, d.v.s. nollhypotesen, är att redaktörer INTE har en tendens att varva män och kvinnor, TROTS att det är detta vi som forskare misstänker.

Som du vet, så kan vi ALDRIG veta säkert vilken hypotes som är sann, oavsett hur många undersökningar vi gör.

Vad vi kan göra är att svara på frågan: ”OM nollhypotesen är sann, d.v.s. om vår misstanke INTE är korrekt, hur stor är då sannolikheten att vi ändå skulle upptäcka att kapitlen följer mönstret ”varannan damernas”?

Denna sannolikhet betecknar vi:

p( D | H_0 )

… eller, med ord: ”sannolikheten för data, GIVET att nollhypotesen är sann.

Återigen: Vi kan ALDRIG ta reda på vilken av våra konkurrerande hypoteser som ÄR sann. Vi kan bara undersöka sannolikheten för att våra undersökningar ska ge de resultat, de DATA, som vi faktiskt ser när vi utför en undersökning OM en viss hypotes är sann.

Om vi kommer fram till att denna sannolikhet är LITEN (ofta använder man gränsen p < 0.05) så säger vi att våra resultat är SIGNIFIKANTA. Det betyder i så fall INTE att vi då vet att vår misstanke är sann (alltså att redaktörer har en tendens att varva kvinnor och män. Det betyder INTE heller att sannolikheten för att vår misstanke är korrekt är 95 %. Det betyder alltså endast att OM vår misstanke INTE är korrekt så har något ganska osannolikt hänt när vi genomförde vår undersökning.

Det är ett mycket vanligt misstag att tro att undersökningar ger oss svar på om vår forskningshypotes, eller misstanke, är korrekt. Ett lika vanligt misstag är att tro att signifikans är ett mått på hur sannolikt det är att vår hypotes är korrekt. Så är det alltså INTE.

Men om vi nu kommer fram till att sannolikheten för att kapitlen ska följa ordningen ”varannan damernas” är liten, d.v.s. om resultatet av vår undersökning är signifikant (p < 0.05)? Vad kan vi säga då?

Jo, att OM världen är så tråkig att redaktörer INTE följer principen ”varannan damernas” så har något ganska osannolikt hänt. Alltså något ganska ovanligt.

Vad vi också kan säga är det här:

ANTINGEN är världen tråkig och vi har bara råkat få se något ganska ovanligt (och ovanliga saker händer ju faktiskt; om sannolikheten för en händelse är 0.05 så innebär det att den faktiskt inträffar ungefär var 20:e gång vi genomför en undersökning)

ELLER så är det så att världen INTE är tråkig. I så fall kanske det beror på att vår misstanke är korrekt.

Därför väljer vi att, preliminärt, ”förkasta nollhypotesen”. Vi väljer i stället att tro på vår forskningshypotes, tills vidare. Detta innebär i sin tur att det KAN vara så att vår misstanke är befogad. (Eller så finns det andra, eller fler, anledningar till att kapitlen har hamnat i just den ordning vi har observerat.)

Åter till uppgiften: Hur stor är sannolikheten att kapitlen följer ordningen ”varannan damernas” av en slump?

Som du minns från den klassiska definitionen av sannolikhet motsvarar detta kvoten:

antal gynnsamma utfall (G) / totalt antal utfall (T)

Din uppgift är alltså att klura ut vilken siffra som ska stå i täljaren (G), och vilken siffra som ska stå i nämnaren (T)

Ledtrådar:

För att ta reda på G kan du ställa dig frågan: På hur många sätt kan de 8 kapitlen ordnas så att varannan författare är en kvinna och varannan författare är en man?

För att ta reda på T kan du ställa dig frågan: På hur många sätt kan de olika kapitlen placeras, totalt?

Nu är det din tur! Fundera och räkna. Du kommer troligtvis att upptäcka att det är svårt att veta om du har tänkt rätt. Men det finns ett - och endast ett - korrekt svar.

* En bok där kapitlen är skrivna av olika författare; en samlingsvolym

Inga kommentarer:

Skicka en kommentar