Fördelningsfunktioner för en slumpvariabel. Hur man hittar fördelningsfunktionen för en slumpvariabel

Innehållsförteckning:

Fördelningsfunktioner för en slumpvariabel. Hur man hittar fördelningsfunktionen för en slumpvariabel
Fördelningsfunktioner för en slumpvariabel. Hur man hittar fördelningsfunktionen för en slumpvariabel
Anonim

För att hitta fördelningsfunktionerna för slumpvariabler och deras variabler, är det nödvändigt att studera alla egenskaper hos detta kunskapsområde. Det finns flera olika metoder för att hitta värdena i fråga, inklusive att ändra en variabel och generera ett moment. Distribution är ett koncept som bygger på sådana element som spridning, variationer. De karakteriserar dock bara graden av spridningsamplitud.

Fördelningsfunktioner för en slumpvariabel
Fördelningsfunktioner för en slumpvariabel

De viktigaste funktionerna hos slumpvariabler är de som är relaterade och oberoende och jämnt fördelade. Till exempel, om X1 är vikten av en slumpmässigt utvald individ från en manlig population, X2 är vikten av en annan, … och Xn är vikten av ytterligare en person från den manliga befolkningen, då måste vi veta hur den slumpmässiga fungerar X är fördelat. I det här fallet gäller den klassiska satsen som kallas central limit theorem. Det låter dig visa att för stora n följer funktionen standarddistributioner.

Funktioner för en slumpvariabel

The Central Limit Theorem är till för att approximera diskreta värden som övervägs såsom binomial och Poisson. Fördelningsfunktioner av slumpvariabler betraktas först och främst på enkla värden för en variabel. Till exempel, om X är en kontinuerlig slumpvariabel med sin egen sannolikhetsfördelning. I det här fallet utforskar vi hur man hittar täthetsfunktionen för Y med två olika tillvägagångssätt, nämligen fördelningsfunktionsmetoden och förändringen i variabel. För det första beaktas endast en-till-en-värden. Sedan måste du modifiera tekniken för att ändra variabeln för att hitta dess sannolikhet. Slutligen måste vi lära oss hur den inversa kumulativa fördelningsfunktionen kan hjälpa till att modellera slumptal som följer vissa sekventiella mönster.

Metod för distribution av övervägda värden

Metoden för sannolikhetsfördelningsfunktionen för en stokastisk variabel är tillämpbar för att hitta dess densitet. När denna metod används beräknas ett kumulativt värde. Sedan, genom att differentiera den, kan du få sannolikhetstätheten. Nu när vi har fördelningsfunktionsmetoden kan vi titta på några fler exempel. Låt X vara en kontinuerlig stokastisk variabel med en viss sannolikhetstäthet.

Vad är sannolikhetstäthetsfunktionen för x2? Om du tittar på eller ritar funktionen (överst och höger) y \u003d x2, kan du notera att det är ett ökande X och 0 <y<1. Nu måste du använda den övervägda metoden för att hitta Y. Först hittas den kumulativa fördelningsfunktionen, du behöver bara differentiera för att få sannolikhetstätheten. När vi gör det får vi: 0<y<1. Distributionsmetoden har framgångsrikt implementerats för att hitta Y när Y är en ökande funktion av X. Förresten, f(y) integreras till 1 över y.

I det sista exemplet användes stor noggrannhet för att indexera de kumulativa funktionerna och sannolikhetstätheten med antingen X eller Y för att indikera vilken slumpvariabel de tillhörde. Till exempel, när vi hittade den kumulativa fördelningsfunktionen för Y fick vi X. Om du behöver hitta en slumpvariabel X och dess densitet behöver du bara differentiera den.

Variabel förändringsteknik

Låt X vara en kontinuerlig slumpvariabel som ges av en fördelningsfunktion med en gemensam nämnare f (x). I det här fallet, om du sätter värdet på y i X=v (Y), så får du värdet på x, till exempel v (y). Nu måste vi få fördelningsfunktionen för en kontinuerlig stokastisk variabel Y. Där den första och andra likheten äger rum från definitionen av kumulativ Y. Den tredje likheten gäller eftersom den del av funktionen för vilken u (X) ≦ y är även sant att X ≦ v (Y). Och den sista görs för att bestämma sannolikheten i en kontinuerlig stokastisk variabel X. Nu måste vi ta derivatan av FY (y), den kumulativa fördelningsfunktionen av Y, för att få sannolikhetstätheten Y.

Fördelningsfunktion för en kontinuerlig stokastisk variabel
Fördelningsfunktion för en kontinuerlig stokastisk variabel

Generalisering för minskningsfunktionen

Låt X vara en kontinuerlig slumpvariabel med gemensam f (x) definierad över c1<x<c2. Och låt Y=u (X) vara en minskande funktion av X med invers X=v (Y). Eftersom funktionen är kontinuerlig och avtagande, finns det en invers funktion X=v (Y).

För att lösa detta problem kan du samla in kvantitativ data och använda den empiriska kumulativa distributionsfunktionen. Med denna information och tilltalande till den måste du kombinera medelprover, standardavvikelser, mediadata och så vidare.

På liknande sätt kan även en ganska enkel sannolikhetsmodell ha ett stort antal resultat. Till exempel om du slår ett mynt 332 gånger. Då är antalet resultat som erhålls från flips större än google (10100) - ett antal, men inte mindre än 100 kvintiljoner gånger högre än elementarpartiklar i det kända universum. Inte intresserad av en analys som ger svar på alla möjliga utfall. Ett enklare koncept skulle behövas, som antalet huvuden eller det längsta slaget på svansarna. För att fokusera på frågor av intresse accepteras ett specifikt resultat. Definitionen i detta fall är följande: en slumpvariabel är en reell funktion med ett sannolikhetsutrymme.

Omfånget S för en slumpvariabel kallas ibland tillståndsutrymmet. Således, om X är värdet i fråga, så är N=X2, exp ↵X, X2 + 1, tan2 X, bXc och så vidare. Den sista av dessa, som avrundar X till närmaste heltal, kallas golvfunktionen.

Distributionsfunktioner

När fördelningsfunktionen av intresse för en slumpvariabel x har bestämts, blir frågan vanligtvis: "Vad är chansen att X hamnar i någon delmängd av B-värden?". Till exempel, B={udda tal}, B={större än 1} eller B={mellan 2 och 7} för att indikera de resultat som har X, värdetslumpvariabel, i delmängd A. I exemplet ovan kan du alltså beskriva händelserna enligt följande.

{X är ett udda tal}, {X är större än 1}={X> 1}, {X är mellan 2 och 7}={2 <X <7} för att matcha de tre alternativen ovan för delmängd B. Många egenskaper hos slumpmässiga storheter är inte relaterade till ett visst X. De beror snarare på hur X allokerar dess värden. Detta leder till en definition som låter så här: fördelningsfunktionen för en stokastisk variabel x är kumulativ och bestäms av kvantitativa observationer.

Fördelningsfunktion för en diskret stokastisk variabel
Fördelningsfunktion för en diskret stokastisk variabel

Slumpvariabler och fördelningsfunktioner

Därmed kan du beräkna sannolikheten för att fördelningsfunktionen för en slumpvariabel x tar värden i intervallet genom subtraktion. Tänk på att inkludera eller exkludera slutpunkter.

Vi kallar en slumpvariabel diskret om den har ett ändligt eller uträkneligt oändligt tillståndsutrymme. Således är X antalet huvuden på tre oberoende vändningar av ett partiskt mynt som går upp med sannolikheten p. Vi måste hitta den kumulativa fördelningsfunktionen för en diskret slumpvariabel FX för X. Låt X vara antalet toppar i en samling av tre kort. Då Y=X3 via FX. FX börjar vid 0, slutar vid 1 och minskar inte när x-värdena ökar. Den kumulativa FX-distributionsfunktionen för en diskret slumpvariabel X är konstant, förutom hopp. När du hoppar är FX kontinuerlig. Bevisa påståendet om det korrektakontinuiteten för fördelningsfunktionen från sannolikhetsegenskapen är möjlig med hjälp av definitionen. Det låter så här: en konstant slumpmässig variabel har en kumulativ FX som är differentierbar.

För att visa hur detta kan hända kan vi ge ett exempel: ett mål med en enhetsradie. Förmodligen. pilen är jämnt fördelad över det angivna området. För vissa λ> 0. Således ökar fördelningsfunktionerna för kontinuerliga slumpvariabler smidigt. FX har egenskaperna hos en distributionsfunktion.

En man väntar vid busshållplatsen tills bussen kommer. Har själv bestämt att han kommer att vägra när väntan når 20 minuter. Här är det nödvändigt att hitta den kumulativa fördelningsfunktionen för T. Tiden då en person fortfarande kommer att vara på busstationen eller inte kommer att lämna. Trots att den kumulativa fördelningsfunktionen är definierad för varje slumpvariabel. Ändå kommer andra egenskaper att användas ganska ofta: massan för en diskret variabel och fördelningsdensitetsfunktionen för en slumpvariabel. Vanligtvis matas värdet ut genom ett av dessa två värden.

Hitta fördelningsfunktionen för en slumpvariabel
Hitta fördelningsfunktionen för en slumpvariabel

massfunktioner

Dessa värden beaktas av följande egenskaper, som har en allmän (mass) karaktär. Den första bygger på att sannolikheterna inte är negativa. Den andra följer av observationen att mängden för alla x=2S, tillståndsutrymmet för X, bildar en partition av den probabilistiska friheten hos X. Exempel: kasta ett partiskt mynt vars resultat är oberoende. Du kan fortsätta göravissa åtgärder tills du får en roll of heads. Låt X beteckna en slumpvariabel som ger antalet svansar framför det första huvudet. Och p anger sannolikheten för en given åtgärd.

Så, masssannolikhetsfunktionen har följande karakteristiska egenskaper. Eftersom termerna bildar en numerisk sekvens kallas X för en geometrisk slumpvariabel. Geometriskt schema c, cr, cr2,.,,, crn har en summa. Och därför har sn en gräns som n 1. I det här fallet är den oändliga summan gränsen.

Masfunktionen ovan bildar en geometrisk sekvens med ett förhållande. Därför är naturliga tal a och b. Skillnaden mellan värdena i fördelningsfunktionen är lika med värdet på massfunktionen.

Densitetsvärdena som övervägs har en definition: X är en slumpvariabel vars FX-fördelning har en derivata. FX som uppfyller Z xFX (x)=fX (t) dt-1 kallas sannolikhetstäthetsfunktionen. Och X kallas en kontinuerlig slumpvariabel. I kalkylens grundsats är densitetsfunktionen derivatan av fördelningen. Du kan beräkna sannolikheter genom att beräkna bestämda integraler.

Eftersom data samlas in från flera observationer måste mer än en slumpvariabel åt gången övervägas för att modellera de experimentella procedurerna. Därför innebär uppsättningen av dessa värden och deras gemensamma fördelning för de två variablerna X1 och X2 visning av händelser. För diskreta slumpvariabler definieras gemensamma probabilistiska massfunktioner. För kontinuerliga sådana beaktas fX1, X2, därledernas sannolikhetstäthet är uppfylld.

Oberoende slumpvariabler

Två slumpvariabler X1 och X2 är oberoende om två händelser som är associerade med dem är desamma. Med ord, sannolikheten för att två händelser {X1 2 B1} och {X2 2 B2} inträffar samtidigt, y, är lika med produkten av variablerna ovan, att var och en av dem inträffar individuellt. För oberoende diskreta slumpvariabler finns en gemensam probabilistisk massfunktion, som är produkten av den begränsande jonvolymen. För kontinuerliga slumpvariabler som är oberoende är den gemensamma sannolikhetstäthetsfunktionen produkten av marginaldensitetsvärdena. Slutligen betraktar vi n oberoende observationer x1, x2,.,,, xn som härrör från en okänd densitet eller massfunktion f. Till exempel fungerar en okänd parameter i en exponentiell slumpvariabel som beskriver väntetiden för en buss.

Slumpvariabeln ges av fördelningsfunktionen
Slumpvariabeln ges av fördelningsfunktionen

Imitation av slumpvariabler

Huvudmålet med detta teoretiska område är att tillhandahålla de verktyg som behövs för att utveckla slutledningsprocedurer baserade på sunda statistiska vetenskapliga principer. Ett mycket viktigt användningsfall för programvara är således möjligheten att generera pseudodata för att efterlikna faktisk information. Detta gör det möjligt att testa och förbättra analysmetoder innan de behöver användas i riktiga databaser. Detta krävs för att utforska egenskaperna hos datan genommodellering. För många vanliga familjer av slumpvariabler tillhandahåller R kommandon för att generera dem. För andra omständigheter kommer metoder för att modellera en sekvens av oberoende slumpvariabler som har en gemensam fördelning att behövas.

Diskreta slumpvariabler och kommandomönster. Provkommandot används för att skapa enkla och stratifierade slumpmässiga prover. Som ett resultat, om en sekvens x matas in, väljer sample(x, 40) 40 poster från x så att alla val av storlek 40 har samma sannolikhet. Detta använder standardkommandot R för hämtning utan ersättning. Kan också användas för att modellera diskreta slumpvariabler. För att göra detta måste du tillhandahålla ett tillståndsutrymme i vektorn x och massfunktionen f. Ett anrop att ersätta=TRUE indikerar att sampling sker med utbyte. För att sedan ge ett urval av n oberoende slumpvariabler som har en gemensam massfunktion f, används urvalet (x, n, replace=TRUE, prob=f).

Fastställt att 1 är det minsta värdet som representeras och 4 är det största av alla. Om kommandot prob=f utelämnas, kommer provet att sampla enhetligt från värdena i vektor x. Du kan kontrollera simuleringen mot massfunktionen som genererade data genom att titta på det dubbla likhetstecknet,==. Och räkna om observationerna som tar alla möjliga värden för x. Du kan göra ett bord. Upprepa detta för 1000 och jämför simuleringen med motsvarande massfunktion.

Illustration av sannolikhetstransformation

Förstsimulera homogena fördelningsfunktioner av stokastiska variabler u1, u2,.,,, un på intervallet [0, 1]. Cirka 10 % av siffrorna bör ligga inom [0, 3, 0, 4]. Detta motsvarar 10 % av simuleringarna på intervallet [0, 28, 0, 38] för en slumpvariabel med FX-distributionsfunktionen visad. På liknande sätt bör cirka 10 % av de slumpmässiga talen vara i intervallet [0, 7, 0, 8]. Detta motsvarar 10 % simuleringar på intervallet [0, 96, 1, 51] för den slumpmässiga variabeln med fördelningsfunktionen FX. Dessa värden på x-axeln kan erhållas genom att ta inversen från FX. Om X är en kontinuerlig slumpvariabel med densitet fX positiv överallt i dess domän, så ökar fördelningsfunktionen strikt. I det här fallet har FX en invers FX-1-funktion som kallas kvantilfunktionen. FX (x) u endast när x FX-1 (u). Sannolikhetstransformationen följer av analysen av stokastisk variabel U=FX (X).

Sannolikhetsfördelningsfunktion för en stokastisk variabel
Sannolikhetsfördelningsfunktion för en stokastisk variabel

FX har ett intervall på 0 till 1. Det kan inte vara under 0 eller över 1. För värden på u mellan 0 och 1. Om U kan simuleras, måste en slumpvariabel med FX-fördelning vara simuleras via en kvantilfunktion. Ta derivatan för att se att densiteten u varierar inom 1. Eftersom den stokastiska variabeln U har en konstant densitet över intervallet av dess möjliga värden, kallas den enhetlig på intervallet [0, 1]. Den är modellerad i R med kommandot runif. Identiteten kallas en probabilistisk transformation. Du kan se hur det fungerar i exemplet med darttavlan. X mellan 0 och 1, funktionfördelningen u=FX (x)=x2, och därav kvantilfunktionen x=FX-1 (u). Det är möjligt att modellera oberoende observationer av avståndet från mitten av pilskivan och på så sätt skapa enhetliga slumpvariabler U1, U2,.,, Un. Fördelningsfunktionen och den empiriska funktionen bygger på 100 simuleringar av fördelningen av en darttavla. För en exponentiell slumpvariabel, antagligen u=FX (x)=1 - exp (- x), och därmed x=- 1 ln (1 - u). Ibland består logik av likvärdiga påståenden. I det här fallet måste du sammanfoga de två delarna av argumentet. Skärningsidentiteten är liknande för alla 2 {S i i} S, istället för något värde. Unionen Ci är lika med tillståndsutrymmet S och varje par är ömsesidigt uteslutande. Eftersom Bi - är uppdelad i tre axiom. Varje kontroll baseras på motsvarande sannolikhet P. För varje delmängd. Att använda en identitet för att se till att svaret inte beror på om intervallslutpunkterna är inkluderade.

Lagen för fördelningen av funktionen av en stokastisk variabel
Lagen för fördelningen av funktionen av en stokastisk variabel

Exponentialfunktion och dess variabler

För varje utfall i alla händelser används slutligen den andra egenskapen för sannolikheternas kontinuitet, vilket anses vara axiomatiskt. Lagen för fördelningen av funktionen för en slumpvariabel visar här att var och en har sin egen lösning och sitt eget svar.

Rekommenderad: