Vad är Pearsons distributionslag? Svaret på denna breda fråga kan inte vara enkelt och kortfattat. Pearson-systemet designades ursprungligen för att modellera synliga förvrängda observationer. Vid den tiden var det välkänt hur man ställer in en teoretisk modell för att matcha de två första kumulanterna eller ögonblicken av observerade data: vilken sannolikhetsfördelning som helst kan utökas direkt för att bilda en grupp av platsskalor.
Pearsons hypotes om normalfördelningen av kriterier
Utom i patologiska fall kan lokaliseringsskalan göras för att matcha det observerade medelvärdet (första kumulanten) och variansen (andra kumulanten) på ett godtyckligt sätt. Det var dock inte känt hur man konstruerade sannolikhetsfördelningar där skevhet (standardiserad tredje kumulant) och kurtosis (standardiserad fjärde kumulant) kunde kontrolleras lika fritt. Detta behov blev uppenbart när man försökte anpassa kända teoretiska modeller till observerade data,som visade asymmetri.
I videon nedan kan du se analysen av Pearsons chi-distribution.
Historia
I sitt originalverk identifierade Pearson fyra typer av distributioner (numrerade I till IV) utöver normalfördelningen (som ursprungligen var känd som typ V). Klassificeringen beror på om fördelningarna stöds över ett begränsat intervall, på en halvaxel eller på hela den reella linjen, och om de var potentiellt snedställda eller nödvändigtvis symmetriska.
Två utelämnanden korrigerades i den andra artikeln: han omdefinierade typ V-fördelningen (ursprungligen var det bara normalfördelningen, men nu med invers gamma) och introducerade typ VI-fördelningen. Tillsammans täcker de två första artiklarna de fem huvudtyperna av Pearson-systemet (I, III, IV, V och VI). I den tredje uppsatsen introducerade Pearson (1916) ytterligare undertyper.
Förbättra konceptet
Rind uppfann ett enkelt sätt att visualisera parameterutrymmet för Pearson-systemet (eller fördelningen av kriterier), som han senare antog. Idag använder många matematiker och statistiker denna metod. Typerna av Pearson-fördelningar kännetecknas av två kvantiteter, vanligtvis kallade β1 och β2. Den första är kvadraten på asymmetri. Det andra är den traditionella kurtosen, eller det fjärde standardiserade momentet: β2=γ2 + 3.
Moderne matematiska metoder definierar kurtosis γ2 som kumulanter istället för moment, så för en normalfördelning har vi γ2=0 och β2=3. Här är det värt att följa det historiska prejudikatet och använda β2. Diagrammet till höger visar vilken typ en viss Pearson-fördelning är (betecknad med pricken (β1, β2).
Många av de skeva och/eller icke-mesokurtiska distributioner vi känner till idag var ännu inte kända i början av 1890-talet. Det som nu är känt som betafördelningen användes av Thomas Bayes som den bakre parametern för Bernoulli-fördelningen i hans artikel från 1763 om invers sannolikhet.
Betadistributionen blev framträdande på grund av sin närvaro i Pearson-systemet och var känd fram till 1940-talet som Pearson typ I-distribution. Typ II-distributionen är ett specialfall av typ I, men den är vanligtvis inte längre utpekad.
Gamma-distributionen kom från hans eget arbete och var känd som Pearson Type III Normal Distribution innan den fick sitt moderna namn på 1930- och 1940-talen. En uppsats från 1895 av en vetenskapsman presenterade typ IV-distributionen, som innehåller Students t-distribution, som ett specialfall, som föregick William Seely Gossets efterföljande användning med flera år. Hans artikel från 1901 presenterade en fördelning med invers gamma (typ V) och betaprimtal (typ VI).
Another opinion
I enlighet med Ord utvecklade Pearson den grundläggande formen av ekvation (1) baserad på formeln för derivatan av logaritmen för normalfördelningstäthetsfunktionen (som ger en linjär division med kvadratenstrukturera). Många specialister är fortfarande engagerade i att testa hypotesen om fördelningen av Pearson-kriterierna. Och det bevisar sin effektivitet.
Vem var Karl Pearson
Karl Pearson var en engelsk matematiker och biostatistiker. Han är krediterad för att skapa disciplinen matematisk statistik. 1911 grundade han världens första avdelning för statistik vid University College London och gjorde betydande bidrag till områdena biometri och meteorologi. Pearson var också en anhängare av socialdarwinism och eugenik. Han var Sir Francis G altons skyddsling och biograf.
Biometrics
Karl Pearson var avgörande för att skapa skolan för biometri, som var en konkurrerande teori för att beskriva utvecklingen och arvet av befolkningar vid 1900-talets början. Hans serie av arton artiklar "Matematiska bidrag till evolutionsteorin" etablerade honom som grundaren av den biometriska arvsskolan. Faktum är att Pearson ägnade mycket av sin tid under 1893-1904 åt utveckling av statistiska metoder för biometri. Dessa metoder, som idag används allmänt för statistisk analys, inkluderar chi-kvadrattestet, standardavvikelse, korrelation och regressionskoefficienter.
Frågan om ärftlighet
Pearsons ärftlighetslag angav att groddplasman består av element som ärvts från föräldrar, såväl som från mer avlägsna förfäder, vars andel varierade beroende på olika egenskaper. Karl Pearson var en anhängare av G alton, och även om derasverk skilde sig åt i vissa avseenden, använde Pearson en betydande del av sin lärares statistiska begrepp när han formulerade en biometrisk skola för arv, såsom regressionslagen.
Skolfunktioner
Den biometriska skolan, till skillnad från mendelianerna, var inte fokuserad på att tillhandahålla en mekanism för arv, utan på att tillhandahålla en matematisk beskrivning som inte var kausal till sin natur. Medan G alton föreslog en diskontinuerlig evolutionsteori där arter skulle förändras i stora språng snarare än små förändringar som ackumulerades över tiden, pekade Pearson på brister i detta argument och använde faktiskt sina idéer för att utveckla en kontinuerlig evolutionsteori. Mendelianerna föredrog den diskontinuerliga evolutionsteorin.
Medan G alton huvudsakligen fokuserade på tillämpningen av statistiska metoder för att studera ärftlighet, utökade Pearson och hans kollega Weldon sina resonemang inom detta område, variation, korrelationer mellan naturligt och sexuellt urval.
En titt på evolution
För Pearson var inte evolutionsteorin avsedd att identifiera den biologiska mekanism som förklarar arvsmönstren, medan den mendelska metoden förklarade att genen var arvsmekanismen.
Pearson kritiserade Bateson och andra biologer för att de inte använde biometriska metoder i sina studier av evolution. Han fördömde forskare som inte fokuserade påstatistisk giltighet av deras teorier, med angivande av:
"Innan vi kan acceptera [någon orsak till progressiv förändring] som en faktor, måste vi inte bara visa dess rimlighet, utan, om möjligt, visa dess kvantitativa förmåga."
Biologer har fallit under för "nästan metafysiska spekulationer om orsakerna till ärftlighet" som har ersatt processen med att samla in experimentell data, vilket faktiskt kan göra det möjligt för forskare att begränsa potentiella teorier.
naturlagar
För Pearson var naturlagarna användbara för att göra korrekta förutsägelser och för att sammanfatta trender i observerade data. Anledningen var upplevelsen "att en viss sekvens hände och upprepades i det förflutna."
Att identifiera en speciell mekanism för genetik har alltså inte varit en värdig strävan för biologer, som istället borde fokusera på matematiska beskrivningar av empiri. Detta ledde delvis till en bitter tvist mellan biometriker och Mendelianer, inklusive Bateson.
Efter att den senare förkastade ett av Pearsons manuskript som beskrev en ny teori om avkommans variation eller homotypi, grundade Pearson och Weldon företaget Biometrika 1902. Även om det biometriska förhållningssättet till arv så småningom förlorade sitt mendelska perspektiv, är metoderna de utvecklade vid den tiden avgörande för studiet av biologi och evolution idag.