Hur man beräknar varians: förklaring med exempel

Innehållsförteckning:

Hur man beräknar varians: förklaring med exempel
Hur man beräknar varians: förklaring med exempel
Anonim

Sannolikhetsteorin fungerar med slumpvariabler. För stokastiska variabler finns så kallade distributionslagar. En sådan lag beskriver sin slumpmässiga variabel med absolut fullständighet. Men när man arbetar med reella uppsättningar av slumpvariabler är det ofta mycket svårt att omedelbart fastställa lagen för deras fördelning och begränsas till en viss uppsättning numeriska egenskaper. Till exempel är det ofta mycket användbart att beräkna medelvärdet och variansen för en slumpvariabel.

Varför behövs det

Om essensen av den matematiska förväntan är nära medelvärdet för kvantiteten, så i det här fallet berättar spridningen hur värdena för vår kvantitet är utspridda runt denna matematiska förväntan. Till exempel, om vi mätte IQ för en grupp människor och vill undersöka mätresultaten (prov), kommer den matematiska förväntan att visa det ungefärliga medelvärdet av intelligenskvoten för denna grupp människor, och om vi beräknar urvalsvariansen, kommer vi att ta reda på hur resultaten är grupperade runt den matematiska förväntan: ett gäng nära den (liten variation i IQ) eller mer jämnt över hela intervallet från minimum till maxim alt resultat (stor variation, och någonstans i mitten - matematisk förväntan).

För att beräkna variansen behöver du en ny egenskap hos en slumpvariabel - värdets avvikelse från den matematiskaväntar.

Avvikelse

För att förstå hur man beräknar variansen måste du först förstå avvikelsen. Dess definition är skillnaden mellan värdet som en slumpvariabel tar och dess matematiska förväntan. Grovt sett, för att förstå hur ett värde är "spritt" måste man titta på hur dess avvikelse fördelar sig. Det vill säga, vi ersätter värdet av värdet med värdet av dess avvikelse från mattan. förväntningar och utforska dess distributionslagstiftning.

Fördelningslagen för en diskret, det vill säga en slumpvariabel som antar individuella värden, skrivs i form av en tabell, där värdet på värdet är korrelerat med sannolikheten för att det inträffar. Då, i avvikelsefördelningslagen, kommer den slumpmässiga variabeln att ersättas av sin formel, där det finns ett värde (som har behållit sin sannolikhet) och en egen matta. väntar.

Egenskaper hos distributionslagen för avvikelsen för en slumpvariabel

Vi har skrivit ned distributionslagen för avvikelsen för en stokastisk variabel. Från den kan vi hittills bara utvinna en sådan egenskap som den matematiska förväntan. För enkelhetens skull är det bättre att ta ett numeriskt exempel.

Låt det finnas en distributionslag för någon slumpvariabel: X - värde, p - sannolikhet.

distributionslag
distributionslag

Vi beräknar den matematiska förväntan med hjälp av formeln och omedelbart avvikelsen.

Förväntat värde
Förväntat värde

Rattar en ny avvikelsefördelningstabell.

Fördelningslag för avvikelse
Fördelningslag för avvikelse

Vi beräknar förväntningarna här också.

Matematisk förväntan för avvikelse
Matematisk förväntan för avvikelse

Det blir noll. Det finns bara ett exempel, men det kommer alltid att vara så: det är inte svårt att bevisa detta i det allmänna fallet. Formeln för den matematiska förväntan på avvikelsen kan delas upp i skillnaden mellan de matematiska förväntningarna på en slumpvariabel och, hur sned den än låter, den matematiska förväntan på mattan. förväntningar (rekursion, dock), som är desamma, så skillnaden blir noll.

Detta förväntas: trots allt kan avvikelser i tecken vara både positiva och negativa, därför bör de i genomsnitt ge noll.

Hur man beräknar variansen för ett diskret fall. kvantiteter

If mat. det är meningslöst att beräkna avvikelseförväntningen, man får leta efter något annat. Du kan helt enkelt ta de absoluta värdena för avvikelserna (modulo); men med moduler är allt inte så enkelt, så avvikelserna kvadreras och sedan beräknas deras matematiska förväntan. Egentligen är det detta som menas när de pratar om hur man beräknar variansen.

Det vill säga, vi tar avvikelserna, kvadrerar dem och gör en tabell med kvadratiska avvikelser och sannolikheter som motsvarar slumpvariabler. Detta är en ny distributionslag. För att beräkna den matematiska förväntan måste du lägga till produkterna av kvadraten på avvikelsen och sannolikheten.

Enklare formel

Artikeln började dock med det faktum att fördelningen av den initiala slumpvariabeln ofta är okänd. Så det behövs något lättare. Det finns faktiskt en annan formel som låter dig beräkna provvariansen med endast mattan.väntar:

Dispersion - skillnaden mellan mattan. förväntan på kvadraten av en slumpvariabel och, omvänt, kvadraten på dess matta. väntar.

Det finns ett bevis för detta, men det är inte meningsfullt att presentera det här, eftersom det inte har något praktiskt värde (och vi behöver bara beräkna variansen).

Hur beräknar man variansen för en slumpvariabel i variationsserier

I verklig statistik är det omöjligt att spegla alla slumpvariabler (eftersom det, grovt sett, i regel finns ett oändligt antal av dem). Därför är det som kommer in i studien det så kallade representativa urvalet från någon allmän befolkning. Och eftersom de numeriska egenskaperna för alla slumpmässiga variabler från en sådan allmän population beräknas från urvalet, kallas de prov: urvalsmedelvärde respektive urvalsvarians. Du kan beräkna det på samma sätt som det vanliga (genom de kvadratiska avvikelserna).

Prov partisk varians
Prov partisk varians

En sådan spridning kallas dock partisk. Formeln för opartisk varians ser lite annorlunda ut. Det krävs vanligtvis för att beräkna det.

Prov opartisk varians
Prov opartisk varians

Liten tillägg

En ytterligare numerisk egenskap är kopplad till spridning. Den tjänar också till att utvärdera hur den slumpmässiga variabeln sprids runt sin matta. förväntningar. Det är inte så stor skillnad i hur man beräknar variansen och standardavvikelsen: den senare är kvadratroten av den förra.

Rekommenderad: