Grundläggande begrepp för matematisk statistik. Tillämpning av matematisk statistik

2026 Författare: Angel Austin | austin@vogueindustry.com. Senast ändrad: 2025-06-01 07:35:44

Matematisk statistik är en metod som låter dig fatta välgrundade beslut inför osäkra förhållanden. Studiet av metoder för att samla in och systematisera data, bearbeta slutresultaten av experiment och experiment med massslumpmässighet och upptäcka eventuella mönster är vad denna gren av matematik gör. Tänk på de grundläggande begreppen för matematisk statistik.

Skillnad med sannolikhetsteori

Metoder för matematisk statistik skär sig nära sannolikhetsteori. Båda grenarna av matematiken behandlar studier av många slumpmässiga fenomen. De två disciplinerna är förbundna med gränssatser. Det finns dock en stor skillnad mellan dessa vetenskaper. Om sannolikhetsteorin bestämmer egenskaperna hos en process i den verkliga världen på basis av en matematisk modell, så gör matematisk statistik motsatsen - den sätter modellens egenskaper tillbaserat på observerad information.

Step

Tillämpningen av matematisk statistik kan endast utföras i relation till slumpmässiga händelser eller processer, eller snarare, till data som erhållits genom att observera dem. Och detta sker i flera steg. För det första genomgår data från experiment och experiment viss bearbetning. De är beställda för klarhet och enkel analys. Sedan görs en exakt eller ungefärlig uppskattning av de nödvändiga parametrarna för den observerade slumpmässiga processen. De kan vara:

bedömning av sannolikheten för en händelse (dess sannolikhet är initi alt okänd);
studerar beteendet hos en obestämd distributionsfunktion;
förväntningsuppskattning;
variansuppskattning
etc.

Det tredje steget är verifieringen av eventuella hypoteser som ställts före analysen, d.v.s. att få svar på frågan om hur resultaten av experimenten motsvarar de teoretiska beräkningarna. I själva verket är detta huvudstadiet av matematisk statistik. Ett exempel skulle vara att överväga om beteendet hos en observerad slumpmässig process ligger inom normalfördelningen.

Population

De grundläggande begreppen för matematisk statistik inkluderar allmänna populationer och urvalspopulationer. Denna disciplin handlar om studiet av en uppsättning av vissa objekt med avseende på någon egenskap. Ett exempel är en taxichaufförs arbete. Tänk på dessa slumpvariabler:

last eller antal kunder: per dag, före lunch, efter lunch, …;
genomsnittlig restid;
antal inkommande ansökningar eller deras bilagor till stadsdelar och mycket mer.

Det är också värt att notera att det är möjligt att studera en uppsättning liknande slumpmässiga processer, som också kommer att vara en slumpvariabel som kan observeras.

Så, i metoderna för matematisk statistik kallas hela uppsättningen av objekt som studeras eller resultaten av olika observationer som utförs under samma förhållanden på ett givet objekt för den allmänna befolkningen. Med andra ord, mer strikt matematiskt, är det en slumpvariabel som definieras i utrymmet för elementära händelser, med en klass av delmängder betecknade i den, vars element har en känd sannolikhet.

Samplepopulation

Det finns fall då det är omöjligt eller opraktiskt av någon anledning (kostnad, tid) att genomföra en kontinuerlig studie för att studera varje objekt. Att till exempel öppna varje burk med förseglad sylt för att kontrollera dess kvalitet är ett tveksamt beslut, och att försöka uppskatta banan för varje luftmolekyl i en kubikmeter är omöjligt. I sådana fall används metoden för selektiv observation: ett visst antal objekt väljs ut (vanligtvis slumpmässigt) från den allmänna befolkningen och de utsätts för sin analys.

De här begreppen kan tyckas komplicerade till en början. Därför, för att helt förstå ämnet, måste du studera läroboken av V. E. Gmurman "Sannolikhetsteori och matematisk statistik". Således är en samplingsuppsättning eller ett sampel en serie objekt valda slumpmässigt från den allmänna uppsättningen. I strikt matematiska termer är detta en sekvens av oberoende, enhetligt fördelade slumpvariabler, för var och en av vilka fördelningen sammanfaller med den som anges för den allmänna slumpvariabeln.

Grundläggande begrepp

Låt oss kort överväga ett antal andra grundläggande begrepp inom matematisk statistik. Antalet objekt i den allmänna populationen eller urvalet kallas volym. Provvärdena som erhålls under experimentet kallas provförverkligandet. För att en uppskattning av den allmänna befolkningen baserad på ett urval ska vara tillförlitlig är det viktigt med ett så kallat representativt eller representativt urval. Detta innebär att urvalet måste representera populationen fullt ut. Detta kan endast uppnås om alla element i populationen har lika sannolikhet att ingå i urvalet.

Sampler skiljer mellan retur och icke-retur. I det första fallet, i provets innehåll, återförs det upprepade elementet till den allmänna uppsättningen, i det andra fallet är det inte. Vanligtvis används i praktiken provtagning utan ersättningar. Det bör också noteras att storleken på den allmänna befolkningen alltid väsentligt överstiger urvalets storlek. Existeramånga alternativ för provtagningsprocessen:

simple - objekt väljs slumpmässigt en i taget;
typad - befolkningen i allmänhet är indelad i typer, och ett val görs från varje; ett exempel är en undersökning av invånare: män och kvinnor separat;
mekanisk - välj till exempel vart tionde element;
serie - urvalet görs i serier av element.

Statistisk fördelning

Enligt Gmurman är sannolikhetsteori och matematisk statistik extremt viktiga discipliner i den vetenskapliga världen, särskilt i dess praktiska del. Tänk på den statistiska fördelningen av urvalet.

Anta att vi har en grupp elever som testades i matematik. Som ett resultat har vi en uppsättning uppskattningar: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - detta är vårt primära statistiska material.

Först och främst måste vi sortera det, eller utföra en rankningsoperation: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - och därmed få en variationsserie. Antalet repetitioner av var och en av bedömningarna kallas bedömningsfrekvensen och deras förhållande till urvalsstorleken kallas den relativa frekvensen. Låt oss göra en tabell över den statistiska fördelningen av urvalet, eller bara en statistisk serie:

a_i	1	2	3	4	5
p_i	1	1	2	4	3

eller

a_i	1	2	3	4	5
p_i	1/11	1/11	2/11	4/11	3/11

Låt oss ha en slumpvariabel som vi kommer att utföra en serie experiment på och se vilket värde denna variabel har. Anta att hon tog värdet a₁ - m₁ gånger; a₂ - m₂ gånger osv. Storleken på detta prov kommer att vara m₁ + … + m_k=m. Mängden a_{i, där i varierar från 1 till k, är en statistisk serie.}

Intervallfördelning

I boken av VE Gmurman "Probability Theory and Mathematical Statistics" presenteras också en intervallstatistisk serie. Dess sammanställning är möjlig när värdet av funktionen som studeras är kontinuerlig i ett visst intervall och antalet värden är stort. Tänk på en grupp elever, eller snarare, deras längd: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 159, 173 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 elever tot alt. Uppenbarligen är en persons höjd ett kontinuerligt värde. Vi måste definiera intervallsteget. För detta används Sturges formel.

h=	max - min	=	190-156	=	33	=	5, 59
	1+logg_2m		1+logg₂₃₀		5, 9

Därmed kan värdet på 6 tas som storleken på intervallet. Det ska också sägas att värdet 1+log_{2m är formeln förbestämma antalet intervaller (naturligtvis med avrundning). Således, enligt formlerna, erhålls 6 intervall, som var och en har en storlek på 6. Och det första värdet på det initiala intervallet kommer att vara det antal som bestäms av formeln: min - h / 2=156 - 6/2=153. Låt oss göra en tabell som innehåller intervaller och antalet elever vars tillväxt föll inom ett visst intervall.}

H	[153; 159)	[159; 165)	[165; 171)	[171; 177)	[177; 183)	[183; 189)
P	2	5	3	9	8	3
P	0, 06	0, 17	0, 1	0, 3	0, 27	0, 1

Det är naturligtvis inte allt, eftersom det finns mycket fler formler i matematisk statistik. Vi har bara övervägt några grundläggande begrepp.

Distributionsschema

De grundläggande begreppen för matematisk statistik inkluderar också en grafisk representation av fördelningen, som kännetecknas av tydlighet. Det finns två typer av grafer: polygon och histogram. Den första används för en diskret statistisk serie. Och för kontinuerlig distribution, respektive den andra.