Standaarddeviatie: stapsgewijze berekening (artikel) | Khan Academie (2023)

voorstellen

In dit artikel zullen we leren hoe we de standaarddeviatie "met de hand" kunnen berekenen.

Interessant is dat in de echte wereld geen enkele statisticus de standaarddeviatie handmatig berekent. De betrokken berekeningen zijn enigszins ingewikkeld en het risico op fouten is groot. Ook rekenen met de hand is traag. zeer langzaam. Daarom vertrouwen statistici op spreadsheets en computerprogramma's om hun cijfers te kraken.

Dus wat is het punt van dit artikel? Waarom tijd besteden aan het leren van een procedure die statistici eigenlijk niet gebruiken? Het antwoord is dat door met de hand te leren rekenen, we inzicht krijgen in hoe de standaarddeviatie eigenlijk werkt. Deze kennis is waardevol. In plaats van de standaarddeviatie te zien als een magisch getal dat ons wordt gegeven door een spreadsheet of computerprogramma, kunnen we uitleggen waar dat getal vandaan komt.

Een overzicht van hoe de standaarddeviatie wordt berekend

De formule voor standaarddeviatie (SD) is

SD=Xrijst2Nee\Large\text{SD} = \sqrt{\dfrac{\sum\limits_{}^{}{{\lvert x-\mu\rvert^2}}}{N}}SD=NeeXrijst2Starttekst, S, D, Eindtekst, Is gelijk aan, Vierkantswortel, Start Breuk, Som, Startindex, Eindindex, Startindex, Eindindex, Verticale balk openen, x, Minteken, mu, Verticale balk sluiten, Vierkant, Delen Door , N, extreme waarde breuk, extreme waarde vierkantswortel

Waar\EnEnbetekent "totaal",XXXXis een waarde in de dataset,rijst\murijstbestaanis het gemiddelde van de dataset, enNeeNeeNeeNeeis het aantal gegevenspunten in de populatie.

De formule voor de standaarddeviatie lijkt misschien verwarrend, maar we splitsen hem op en het wordt duidelijk. In de volgende paragrafen lopen we stap voor stap door de interactieve voorbeelden. Hier is een kort voorbeeld van de stappen die we gaan nemen:

stap 1:Vind het gemiddelde.

Stap 2:Zoek voor elk gegevenspunt het kwadraat van de afstand tot het gemiddelde.

Stap 3:Voeg de waarden uit stap 2 toe.

Stap 4:Deel door het aantal datapunten.

Stap 5:Neem de vierkantswortel.

belangrijke herinnering

De bovenstaande formule wordt gebruikt om de standaarddeviatie van een populatie te berekenen. Als je te maken hebt met een voorbeeld, wil je een iets andere formule gebruiken (hieronder), die gebruiktN1n-1N1n, negatief teken, 1in plaats vanNeeNeeNeeNeeHet doel van dit artikel is echter om u vertrouwd te maken met het proces van het berekenen van de standaarddeviatie, die in principe hetzelfde is, ongeacht welke formule u gebruikt.

SDsteekproef=XXˉ2N1\text{SD}_\text{sample} = \sqrt{\dfrac{\sum\limits_{}^{}{{\lvert x-\bar{x}\rvert^2}}}{n-1} }SDsteekproef=N1XXˉ2starttekst, s, d, eindtekst, startindex, starttekst, s, a, m, p, l, e, eindtekst, eindindex, is gelijk aan, vierkantswortel, startfractie, som, startindex, eindindex, startindex, eindindex, open balk, x , minus, x, with, \bar, up, close bar, square, delen door, n, minus, 1, end fraction, end square root

[Waarom zijn er twee soorten? 】

Stapsgewijs interactief voorbeeld van het berekenen van de standaarddeviatie

Ten eerste hebben we een dataset nodig om mee te werken. Laten we iets kleins kiezen, zodat we niet overweldigd worden door het aantal datapunten. Hier is een mooie:

Stap 1: zoekenrijst\goldD{\mu}rijstStartkleur #e07d10, mu, eindkleur #e07d10bestaanXrijst2Nee\sqrt{\dfrac{\sum\limits_{}^{}{{\lvert x-\goldD{\mu}\rvert^2}}}{N}}NeeXrijst2vierkantswortel van, start breuk, som, begin subscript, eind subscript, start index, eind index, open verticale balk, x, minteken, start kleur #e07d10, mu, eind kleur #e07d10, sluit verticale balk, vierkant, deel In , N, extreme waarde breuk, extreme waarde vierkantswortel

In deze stap vinden we het gemiddelde van de dataset, die wordt weergegeven door de variabelerijst\murijstbestaan.

vul de blanco in.

rijst=\op=rijst=m gelijk aan

[uitleggen]

Stap 2: zoekenXrijst2\goldD{\lvert x - \mu \rvert^2}Xrijst2start kleur #e07d10 zet verticale lijn aan x min mu zet verticale lijn vierkant uit einde kleur #e07d10bestaanXrijst2Nee\sqrt{\dfrac{\sum\limits_{}^{}{\goldD{{\lvert x-\mu}\rvert^2}}}{N}}NeeXrijst2vierkantswortel van, start breuk, som, begin subscript, eind subscript, start index, eind index, start kleur #e07d10, open verticale lijn, x, minteken, mu, sluit verticale lijn, vierkant, eind kleur #e07d10, deel In , N, extreme waarde breuk, extreme waarde vierkantswortel

In deze stap vinden we de afstand van elk gegevenspunt tot het gemiddelde (d.w.z. de afwijking) en kwadrateren we elk van deze afstanden.

Het eerste datapunt is bijvoorbeeld6666het gemiddelde is3333, dus de afstand tussen hen is3333Het kwadrateren van deze afstand geeft ons9999.

Vul onderstaand formulier in.

data puntXXXXkwadratische afstand van het gemiddeldeXrijst2\lvert x - \mu \rvert^2Xrijst2verticale lijn openen, x, minteken, mu, verticale lijn sluiten, vierkant
66669999
2222
3333
1111

[uitleggen]

Stap 3: zoekenXrijst2\goldD{\sum\lvert x - \mu \rvert^2}Xrijst2startkleur #e07d10, som, open verticale lijn, x, minteken, mu, sluit verticale lijn, vierkant, eindkleur #e07d10bestaanXrijst2Nee\sqrt{\dfrac{\goldD{\sum\limits_{}^{}{{\lvert x-\mu}\rvert^2}}}{N}}NeeXrijst2vierkantswortel van, start breuk, startkleur #e07d10, som, startindex, eindindex, startindex, eindindex, open verticale lijn, x, minteken, mu, sluit verticale lijn, vierkant, eindkleur #e07d10, delen, N, uiterste waarde breuk, extreme waarde vierkantswortel

symbool\EnEnbetekent "optellen", dus in deze stap tellen we de vier waarden op die we in stap 2 hebben gevonden.

vul de blanco in.

Xrijst2=\sum\lvert x - \mu \rvert^2 =Xrijst2=som, open verticale lijn, x, minteken, mu, sluit verticale lijn, vierkant, gelijk

[uitleggen]

Stap 4: zoekenXrijst2Nee\goldD{\dfrac{\sum\lvert x - \mu \rvert^2}{N}}NeeXrijst2start kleur #e07d10, begin breuk, som, open verticale lijn, x, minteken, mu, sluit verticale lijn, vierkant, deel door, N, eind breuk, eind kleur #e07d10bestaanXrijst2Nee\sqrt{\goldD{\dfrac{\sum\limits_{}^{}{{\lvert x-\mu}\rvert^2}}{N}}}NeeXrijst2vierkantswortel van, start kleur #e07d10, start breuk, som, start subscript, eind subscript, start index, eind index, open verticale lijn, x, min, mu, sluit verticale lijn, vierkant, deel, N, eind breuk, einde kleur #e07d10, einde vierkantswortel

In deze stap delen we het resultaat van stap 3 door de variabeleNeeNeeNeeNee, wat het aantal gegevenspunten is.

vul de blanco in.

Xrijst2Nee=\dfrac{\som\lvert x - \mu \rvert^2}{N} =NeeXrijst2=Start breuk, som, open balk, x, min, mu, sluit balk, vierkant, delen, N, eind breuk, is gelijk aan

[uitleggen]

Stap 5: Zoek de standaarddeviatieXrijst2Nee\sqrt{\dfrac{\sum\limits_{}^{}{{\lvert x-\mu\rvert^2}}}{N}}NeeXrijst2vierkantswortel van, start breuk, som, begin subscript, eind subscript, start index, eind index, open verticale lijn, x, minteken, mu, sluit verticale lijn, kwadraat, deel, N, eind breuk, eind vierkantswortel

We zijn bijna klaar! Neem gewoon de vierkantswortel van het antwoord uit stap 4.

vul de blanco in.
Rond je antwoord af op de dichtstbijzijnde centimeter.

SD=Xrijst2Nee\text{SD} = \sqrt{\dfrac{\sum\limits_{}^{}{{\lvert x-\mu\rvert^2}}}{N}} \περίπουSD=NeeXrijst2Starttekst, S, D, Eindtekst, Is gelijk aan, Vierkantswortel, Start Breuk, Som, Startindex, Eindindex, Startindex, Eindindex, Verticale balk openen, x, Minteken, mu, Verticale balk sluiten, Vierkant, Delen Door , N, acral-fractie, acral-vierkantswortel, ca.

[uitleggen]

Ja! We hebben het gedaan! We hebben met succes de standaarddeviatie berekend voor een kleine dataset.

samenvatting van wat we hebben gedaan

We splitsen de formule op in vijf stappen:

stap 1:gemiddeldrijst\murijstbestaan.

rijst=6+2+3+14=124=3\mu = \dfrac{6+2 + 3 + 1}{4} = \dfrac{12}{4} = \blueD3rijst=46+2+3+1=412=3mu, gelijk, start breuk, 6, plus, 2, plus, 3, plus, 1, delen door, 4, eind breuk, gelijk, begin breuk, 12, gedeeld door, 4, eind breuk, gelijk, start kleur #11accd , 3, eindkleur #11incl

Stap 2:Bereken het kwadraat van de afstand van elk gegevenspunt tot het gemiddeldeXrijst2\lvert x-\mu\rvert^2Xrijst2verticale lijn openen, x, minteken, mu, verticale lijn sluiten, vierkant.

XXXXXrijst2\lvert x - \mu \rvert^2Xrijst2verticale lijn openen, x, minteken, mu, verticale lijn sluiten, vierkant
6666632=32=9\lvert6-\blueD{3}\rvert^2 = 3^2 = 9632=32=9Verticale lijn openen, 6, minteken, startkleur #11accd, 3, eindkleur #11accd, verticale lijn sluiten, vierkant, gelijk aan, 3, vierkant, gelijk aan, 9
2222232=12=1\lvert2-\blueD{3}\rvert^2 = 1^2 = 1232=12=1Verticale lijn openen, 2, min, startkleur #11accd, 3, eindkleur #11accd, verticale lijn sluiten, vierkant, gelijk aan, 1, vierkant, gelijk aan, 1
3333332=02=0\lvert3-\blueD{3}\rvert^2 = 0^2 = 0332=02=0Verticale lijn openen, 3, min, startkleur #11accd, 3, eindkleur #11accd, verticale lijn sluiten, vierkant, gelijk aan, 0, vierkant, gelijk aan, 0
1111132=22=4\lvert1-\blueD{3}\rvert^2 = 2^2 = 4132=22=4Verticale lijn openen, 1, min, startkleur #11accd, 3, eindkleur #11accd, verticale lijn sluiten, vierkant, gelijk aan, 2, vierkant, gelijk aan, 4

Stappen 3, 4 en 5:

SD=Xrijst2Nee=9+1+0+44=144Tel de kwadraten van deze stand op (stap 3).=3.5Deel door het aantal datapunten (stap 4).1,87Neem de vierkantswortel (stap 5).\begin{uitgelijnd} \text{SD} &= \sqrt{\dfrac{\sum\limits_{}^{}{{\lvert x-\mu\rvert^2}}}{N}}\\\\ \\\\ &= \sqrt{\dfrac{9 + 1 + 0 + 4}{4}} \\\\\\\ &= \sqrt{\dfrac{{14}}{4}} ~~ ~ ~~~~~\small \text{Som van kwadraten van afstanden (stap 3). } \\\\\\\\\ &= \sqrt{{3.5}} ~~~~~~~~ \small \text{gedeeld door het aantal datapunten (stap 4)} \\\\\\ \\& \about 1.87 ~~~~~~~~\small \text{neem de vierkantswortel (stap 5). }\end{overeenkomst}SD=NeeXrijst2=49+1+0+4=414Tel de kwadraten van deze stand op (stap 3).=3.5Deel door het aantal datapunten (stap 4).1.87Neem de vierkantswortel (stap 5).

probeer het zelf

Hier is een herinnering aan de formule:

SD=Xrijst2Nee\Large\text{SD} = \sqrt{\dfrac{\sum\limits_{}^{}{{\lvert x-\mu\rvert^2}}}{N}}SD=NeeXrijst2Starttekst, S, D, Eindtekst, Is gelijk aan, Vierkantswortel, Start Breuk, Som, Startindex, Eindindex, Startindex, Eindindex, Verticale balk openen, x, Minteken, mu, Verticale balk sluiten, Vierkant, Delen Door , N, extreme waarde breuk, extreme waarde vierkantswortel

Hier is een dataset:

1,4,7,2,61, 4, 7, 2,61,4,7,2,61 segment 4 segment 7 segment 2 segment 6

Zoek de standaarddeviatie van een dataset.
Rond je antwoord af op de dichtstbijzijnde centimeter.

SD=\tekst{SD}=SD=StartText, S, D, EndText, Equal

[uitleggen]

References

Top Articles
Latest Posts
Article information

Author: Neely Ledner

Last Updated: 02/08/2023

Views: 5789

Rating: 4.1 / 5 (42 voted)

Reviews: 89% of readers found this page helpful

Author information

Name: Neely Ledner

Birthday: 1998-06-09

Address: 443 Barrows Terrace, New Jodyberg, CO 57462-5329

Phone: +2433516856029

Job: Central Legal Facilitator

Hobby: Backpacking, Jogging, Magic, Driving, Macrame, Embroidery, Foraging

Introduction: My name is Neely Ledner, I am a bright, determined, beautiful, adventurous, adventurous, spotless, calm person who loves writing and wants to share my knowledge and understanding with you.