Kriterier och metoder för att testa statistiska hypoteser, exempel

Innehållsförteckning:

Kriterier och metoder för att testa statistiska hypoteser, exempel
Kriterier och metoder för att testa statistiska hypoteser, exempel
Anonim

Hypotestestning är en nödvändig procedur inom statistik. Ett hypotestest utvärderar två ömsesidigt uteslutande påståenden för att avgöra vilket påstående som bäst stöds av provdata. När ett fynd sägs vara statistiskt signifikant beror det på ett hypotestest.

Verifieringsmetoder

Metoder för att testa statistiska hypoteser är metoder för statistisk analys. Vanligtvis jämförs två uppsättningar statistik, eller så jämförs en samplad datauppsättning med en syntetisk datauppsättning från en idealiserad modell. Uppgifterna måste tolkas på ett sådant sätt att de tillför nya betydelser. Du kan tolka dem genom att anta en viss struktur av slutresultatet och använda statistiska metoder för att bekräfta eller förkasta antagandet. Antagandet kallas en hypotes, och de statistiska tester som används för detta ändamål kallas statistiska hypoteser.

H0 och H1-hypoteser

Det finns två huvudsakligabegreppen statistisk testning av hypoteser - den så kallade "huvud- eller nollhypotesen" och " alternativhypotesen". De kallas också för Neyman-Pearson-hypoteser. Det statistiska testantagandet kallas nollhypotesen, huvudhypotesen eller förkortat H0. Det kallas ofta standardantagandet eller antagandet att ingenting har förändrats. En överträdelse av testantaganden kallas ofta för den första hypotesen, alternativ hypotes eller H1. H1 är en förkortning för någon annan hypotes, eftersom allt vi vet om det är att H0-data kan kasseras.

nollhypotestest
nollhypotestest

Innan man förkastar eller inte förkastar nollhypotesen måste testresultatet tolkas. En jämförelse anses vara statistiskt signifikant om förhållandet mellan datamängderna sannolikt inte är implementeringen av nollhypotesen enligt tröskelsannolikheten - signifikansnivån. Det finns också godhetskriterier för statistisk hypotestestning. Detta är namnet på hypotestestkriteriet, som är associerat med den förmodade lagen om den okända fördelningen. Detta är ett numeriskt mått på diskrepansen mellan den empiriska och teoretiska fördelningen.

Procedur och kriterier för att testa statistiska hypoteser

De vanligaste hypotesvalsmetoderna är baserade på antingen Akaike-informationskriteriet eller den Bayesianska koefficienten. Statistisk hypotestestning är en nyckelteknik i både inferens och Bayesiansk slutledning, även om de två typerna har anmärkningsvärda skillnader. Statistiska hypotestestdefiniera en procedur som kontrollerar sannolikheten för att felaktigt besluta om en felaktig standard- eller nollhypotes. Proceduren baseras på hur sannolikt det är att det fungerar. Denna sannolikhet att fatta ett felaktigt beslut är osannolikheten att nollhypotesen är sann och att ingen speciell alternativ hypotes existerar. Testet kan inte visa om det är sant eller falskt.

Metoder för att testa statistiska hypoteser
Metoder för att testa statistiska hypoteser

Alternativa metoder för beslutsteori

Alternativa metoder för beslutsteori finns, där noll- och förstahypoteserna betraktas på en mer jämställd grund. Andra beslutsfattande tillvägagångssätt, såsom Bayesiansk teori, försöker balansera konsekvenserna av dåliga beslut över alla möjligheter snarare än att fokusera på en enda nollhypotes. Ett antal andra tillvägagångssätt för att avgöra vilken av hypoteserna som är korrekt baseras på data, vilka av dem som har de önskade egenskaperna. Men hypotestestning är den dominerande metoden för dataanalys inom många vetenskapsområden.

Testar den statistiska hypotesen

När en uppsättning resultat skiljer sig från en annan uppsättning måste man förlita sig på statistiska hypotestest eller statistiska hypotestest. Deras tolkning kräver en ordentlig förståelse av p-värden och kritiska värden. Det är också viktigt att förstå att tester, oavsett signifikansnivå, fortfarande kan innehålla fel. Därför kanske slutsatsen inte är korrekt.

Testprocessen består avflera steg:

  1. En första hypotes skapas för forskning.
  2. Relevanta noll- och alternativa hypoteser anges.
  3. Förklarar statistiska antaganden om urvalet i testet.
  4. Bestämma vilket test som är lämpligt.
  5. Välj signifikansnivån och sannolikhetströskeln under vilken nollhypotesen kommer att förkastas.
  6. Fördelningen av nollhypotesteststatistiken visar de möjliga värden vid vilka nollhypotesen förkastas.
  7. Beräkning pågår.
  8. Ett beslut fattas om att förkasta eller acceptera nollhypotesen till förmån för ett alternativ.

Det finns ett alternativ som använder ett p-värde.

Exempel på att testa statistiska hypoteser
Exempel på att testa statistiska hypoteser

signifikanstester

Ren data är till ingen praktisk användning utan tolkning. Inom statistiken, när det gäller att ställa frågor om data och tolka resultat, används statistiska metoder för att säkerställa riktigheten eller sannolikheten för svar. När man testar statistiska hypoteser kallas denna klass av metoder för statistisk testning, eller signifikanstest. Termen”hypotes” påminner om vetenskapliga metoder, där hypoteser och teorier undersöks. I statistiken resulterar ett hypotestest i en kvantitet givet ett givet antagande. Det låter dig tolka om ett antagande är sant eller om en överträdelse har gjorts.

Statistisk tolkning av test

Hypotestestanvänds för att avgöra vilka forskningsresultat som kommer att leda till att nollhypotesen förkastas för en förutbestämd nivå av signifikans. Resultaten av ett statistiskt hypotestest måste tolkas så att arbetet kan fortsätta med det. Det finns två vanliga former av statistiska hypotestestkriterier. Dessa är p-värden och kritiska värden. Beroende på det valda kriteriet måste de erhållna resultaten tolkas olika.

Vad är ett p-värde

Output beskrivs som statistiskt signifikant vid tolkning av p-värdet. Faktum är att denna indikator betyder sannolikheten för fel om nollhypotesen förkastas. Med andra ord kan den användas för att namnge ett värde som kan användas för att tolka eller kvantifiera ett testresultat, och för att bestämma sannolikheten för fel vid förkastande av nollhypotesen. Till exempel kan du utföra ett normalitetstest på ett urval av data och upptäcka att det finns liten chans att avvika. Nollhypotesen behöver dock inte förkastas. Ett statistiskt hypotestest kan returnera ett p-värde. Detta görs genom att jämföra värdet av p med ett förutbestämt tröskelvärde som kallas signifikansnivån.

Statistisk testning av nollhypoteser
Statistisk testning av nollhypoteser

Betydningsnivå

Nivån av betydelse skrivs ofta med den grekiska gemena bokstaven "alfa". Det allmänna värdet som används för alfa är 5 % eller 0,05. Ett lägre alfavärde tyder på en mer tillförlitlig tolkning av nollhypotesen. P-värdet jämförs medförv alt alfavärde. Resultatet är statistiskt signifikant om p-värdet är mindre än alfa. Signifikansnivån kan inverteras genom att subtrahera den från en. Detta görs för att bestämma konfidensnivån för hypotesen givet de observerade provdata. När man använder denna metod för att testa statistiska hypoteser är P-värdet probabilistiskt. Det betyder att man i processen att tolka resultatet av ett statistiskt test inte vet vad som är sant eller falskt.

Statistisk hypotestestningsteori

Avvisning av nollhypotesen betyder att det finns tillräckligt med statistiska bevis för att det ser troligt ut. Annars betyder det att det inte finns tillräckligt med statistik för att avvisa det. Man kan tänka sig statistiska test i termer av dikotomi att förkasta och acceptera nollhypotesen. Faran med statistisk testning av nollhypotesen är att den, om den accepteras, kan tyckas vara sann. Istället skulle det vara mer korrekt att säga att nollhypotesen inte förkastas eftersom det inte finns tillräckligt med statistiska bevis för att förkasta den.

Statistisk hypotes som testar godhetskriterier
Statistisk hypotes som testar godhetskriterier

Det här ögonblicket förvirrar ofta nybörjare. I ett sådant fall är det viktigt att påminna sig själv om att resultatet är sannolikhet och att även om man accepterar nollhypotesen har en liten risk för fel.

Sant eller falsk nollhypotes

Tolkning av värdet på p betyder inte att nollhypotesen är sann eller falsk. Det innebär att man har v alt att förkasta eller inte förkasta nollhypotesen vid en viss statistisk signifikansnivå baserat på empirin och det valda statistiska testet. Därför kan p-värdet ses som sannolikheten för data som ges under ett förutbestämt antagande inbäddat i de statistiska testerna. P-värdet är ett mått på hur sannolikt dataprovet kommer att observeras om nollhypotesen är sann.

Tolkning av kritiska värden

Vissa tester returnerar inte sid. Istället kan de returnera en lista med kritiska värden. Resultaten av en sådan studie tolkas på ett liknande sätt. Istället för att jämföra ett enskilt p-värde med en förutbestämd signifikansnivå jämförs teststatistiken med ett kritiskt värde. Om det visar sig vara mindre betyder det att det inte var möjligt att förkasta nollhypotesen. Om den är större än eller lika bör nollhypotesen förkastas. Innebörden av den statistiska hypotestestningsalgoritmen och tolkningen av dess resultat liknar p-värdet. Den valda signifikansnivån är ett probabilistiskt beslut att förkasta eller inte förkasta bastestantagandet givet data.

Fel i statistiska tester

Tolkningen av ett statistiskt hypotestest är probabilistisk. Uppgiften att testa statistiska hypoteser är inte att hitta ett sant eller falskt påstående. Testbevis kan vara felaktigt. Till exempel, om alfa var 5 %, betyder det att för det mesta 1 av 20nollhypotesen kommer att förkastas av misstag. Eller så gör det inte det på grund av det statistiska bruset i dataprovet. Givet denna punkt kan ett litet p-värde för att förkasta nollhypotesen betyda att den är falsk eller att ett fel har gjorts. Om denna typ av fel görs kallas resultatet ett falskt positivt. Och ett sådant fel är ett fel av det första slaget när man testar statistiska hypoteser. Å andra sidan, om p-värdet är tillräckligt stort för att betyda förkastande av nollhypotesen, kan det betyda att det är sant. Eller är inte korrekt, och någon osannolik händelse inträffade på grund av vilken felet gjordes. Den här typen av fel kallas falskt negativ.

Statistisk testning av nollhypoteser
Statistisk testning av nollhypoteser

Sannolikhet för fel

När man testar statistiska hypoteser finns det fortfarande en chans att göra någon av dessa typer av fel. Falska data eller falska slutsatser är ganska troliga. Helst bör en signifikansnivå väljas som minimerar sannolikheten för ett av dessa fel. Till exempel kan statistisk testning av nollhypoteser ha en mycket låg signifikansnivå. Även om signifikansnivåer som 0,05 och 0,01 är vanliga inom många vetenskapsområden, är den vanligaste signifikansnivån 310^-7 eller 0,0000003. Den kallas ofta för "5-sigma". Det betyder att slutsatsen var slumpmässig med en sannolikhet på 1 på 3,5 miljoner oberoende upprepningar av experimenten. Exempel på att testa statistiska hypoteser innehåller ofta sådana fel. Detta är också anledningen till att det är viktigt med oberoende resultat.verifiering.

Exempel på användning av statistisk verifiering

Det finns flera vanliga exempel på hypotesprövning i praktiken. En av de mest populära är känd som "Tea Tasting". Dr Muriel Bristol, en kollega till biometrins grundare Robert Fisher, påstod sig kunna säga säkert om det tillsattes först i en kopp te eller mjölk. Fisher erbjöd sig att ge henne åtta koppar (fyra av varje sort) på måfå. Teststatistiken var enkel: att räkna antalet framgångar med att välja en cup. Den kritiska regionen var den enda framgången av 4, möjligen baserat på det vanliga sannolikhetskriteriet (< 5 %; 1 av 70 ≈ 1,4 %). Fisher hävdade att en alternativ hypotes inte krävs. Damen identifierade korrekt varje kopp, vilket ansågs vara ett statistiskt signifikant resultat. Denna erfarenhet ledde till Fishers bok Statistical Methods for Researchers.

Svarande exempel

Det statistiska rättegångsförfarandet är jämförbart med en brottmålsdomstol där den tilltalade antas vara oskyldig tills motsatsen bevisats. Åklagaren försöker bevisa den tilltalades skuld. Först när det finns tillräckliga bevis för ett åtal kan den tilltalade befinnas skyldig. I början av förfarandet finns det två hypoteser: "Den tilltalade är inte skyldig" och "Den tilltalade är skyldig." Hypotesen om oskuld kan bara förkastas när fel är mycket osannolikt eftersom man inte vill döma en oskyldig tilltalad. Ett sådant fel kallas ett typ I-fel och dess förekomstsällan kontrolleras. Som en konsekvens av detta asymmetriska beteende är typ II-fel, d.v.s. frikännande av gärningsmannen, vanligare.

Statistiska valideringsexempel
Statistiska valideringsexempel

Statistik är användbar när man analyserar stora mängder data. Detta gäller likaväl prövningen av hypoteser som kan motivera slutsatserna även om det inte finns någon vetenskaplig teori. I teprovningsexemplet var det "uppenbart" att det inte var någon skillnad mellan att hälla mjölk i te eller hälla te i mjölk.

Verklig praktisk tillämpning av hypotestestning inkluderar:

  • testar om män har fler mardrömmar än kvinnor;
  • dokumenttillskrivning;
  • Bedömning av fullmånens inverkan på beteendet;
  • bestämmer intervallet inom vilket en fladdermus kan upptäcka en insekt med hjälp av ett eko;
  • välja det bästa sättet att sluta röka;
  • Kontrollerar om bildekaler återspeglar bilägarens beteende.

Statistisk hypotestestning spelar en viktig roll i statistik i allmänhet och i statistisk slutledning. Värdetestning används som en ersättning för den traditionella jämförelsen av förutsagt värde och experimentellt resultat i kärnan i den vetenskapliga metoden. När en teori endast är kapabel att förutsäga tecknet på ett samband, kan riktade hypotestest konfigureras på ett sådant sätt att endast ett statistiskt signifikant resultat stöder teorin. Denna form av utvärderingsteori är den mest stelakritik mot användningen av hypotestestning.

Rekommenderad: