voorstellen
In dit artikel zullen we leren hoe we de standaarddeviatie "met de hand" kunnen berekenen.
Interessant is dat in de echte wereld geen enkele statisticus de standaarddeviatie handmatig berekent. De betrokken berekeningen zijn enigszins ingewikkeld en het risico op fouten is groot. Ook rekenen met de hand is traag. zeer langzaam. Daarom vertrouwen statistici op spreadsheets en computerprogramma's om hun cijfers te kraken.
Dus wat is het punt van dit artikel? Waarom tijd besteden aan het leren van een procedure die statistici eigenlijk niet gebruiken? Het antwoord is dat door met de hand te leren rekenen, we inzicht krijgen in hoe de standaarddeviatie eigenlijk werkt. Deze kennis is waardevol. In plaats van de standaarddeviatie te zien als een magisch getal dat ons wordt gegeven door een spreadsheet of computerprogramma, kunnen we uitleggen waar dat getal vandaan komt.
Een overzicht van hoe de standaarddeviatie wordt berekend
De formule voor standaarddeviatie (SD) is
SD=Nee∑∀X−rijst∀2Starttekst, S, D, Eindtekst, Is gelijk aan, Vierkantswortel, Start Breuk, Som, Startindex, Eindindex, Startindex, Eindindex, Verticale balk openen, x, Minteken, mu, Verticale balk sluiten, Vierkant, Delen Door , N, extreme waarde breuk, extreme waarde vierkantswortel
Waar∑Enbetekent "totaal",XXis een waarde in de dataset,rijstbestaanis het gemiddelde van de dataset, enNeeNeeis het aantal gegevenspunten in de populatie.
De formule voor de standaarddeviatie lijkt misschien verwarrend, maar we splitsen hem op en het wordt duidelijk. In de volgende paragrafen lopen we stap voor stap door de interactieve voorbeelden. Hier is een kort voorbeeld van de stappen die we gaan nemen:
stap 1:Vind het gemiddelde.
Stap 2:Zoek voor elk gegevenspunt het kwadraat van de afstand tot het gemiddelde.
Stap 3:Voeg de waarden uit stap 2 toe.
Stap 4:Deel door het aantal datapunten.
Stap 5:Neem de vierkantswortel.
belangrijke herinnering
De bovenstaande formule wordt gebruikt om de standaarddeviatie van een populatie te berekenen. Als je te maken hebt met een voorbeeld, wil je een iets andere formule gebruiken (hieronder), die gebruiktN−1n, negatief teken, 1in plaats vanNeeNeeHet doel van dit artikel is echter om u vertrouwd te maken met het proces van het berekenen van de standaarddeviatie, die in principe hetzelfde is, ongeacht welke formule u gebruikt.
SDsteekproef=N−1∑∀X−Xˉ∀2starttekst, s, d, eindtekst, startindex, starttekst, s, a, m, p, l, e, eindtekst, eindindex, is gelijk aan, vierkantswortel, startfractie, som, startindex, eindindex, startindex, eindindex, open balk, x , minus, x, with, \bar, up, close bar, square, delen door, n, minus, 1, end fraction, end square root
[Waarom zijn er twee soorten? 】
Stapsgewijs interactief voorbeeld van het berekenen van de standaarddeviatie
Ten eerste hebben we een dataset nodig om mee te werken. Laten we iets kleins kiezen, zodat we niet overweldigd worden door het aantal datapunten. Hier is een mooie:
6,2,3,16, lid, 2, lid, 3, lid, 1
Stap 1: zoekenrijstStartkleur #e07d10, mu, eindkleur #e07d10bestaanNee∑∀X−rijst∀2vierkantswortel van, start breuk, som, begin subscript, eind subscript, start index, eind index, open verticale balk, x, minteken, start kleur #e07d10, mu, eind kleur #e07d10, sluit verticale balk, vierkant, deel In , N, extreme waarde breuk, extreme waarde vierkantswortel
In deze stap vinden we het gemiddelde van de dataset, die wordt weergegeven door de variabelerijstbestaan.
vul de blanco in.
rijst=m gelijk aan
[uitleggen]
Stap 2: zoeken∀X−rijst∀2start kleur #e07d10 zet verticale lijn aan x min mu zet verticale lijn vierkant uit einde kleur #e07d10bestaanNee∑∀X−rijst∀2vierkantswortel van, start breuk, som, begin subscript, eind subscript, start index, eind index, start kleur #e07d10, open verticale lijn, x, minteken, mu, sluit verticale lijn, vierkant, eind kleur #e07d10, deel In , N, extreme waarde breuk, extreme waarde vierkantswortel
In deze stap vinden we de afstand van elk gegevenspunt tot het gemiddelde (d.w.z. de afwijking) en kwadrateren we elk van deze afstanden.
Het eerste datapunt is bijvoorbeeld66het gemiddelde is33, dus de afstand tussen hen is33Het kwadrateren van deze afstand geeft ons99.
Vul onderstaand formulier in.
data puntXX | kwadratische afstand van het gemiddelde∀X−rijst∀2verticale lijn openen, x, minteken, mu, verticale lijn sluiten, vierkant |
---|---|
66 | 99 |
22 | |
33 | |
11 |
[uitleggen]
Stap 3: zoeken∑∀X−rijst∀2startkleur #e07d10, som, open verticale lijn, x, minteken, mu, sluit verticale lijn, vierkant, eindkleur #e07d10bestaanNee∑∀X−rijst∀2vierkantswortel van, start breuk, startkleur #e07d10, som, startindex, eindindex, startindex, eindindex, open verticale lijn, x, minteken, mu, sluit verticale lijn, vierkant, eindkleur #e07d10, delen, N, uiterste waarde breuk, extreme waarde vierkantswortel
symbool∑Enbetekent "optellen", dus in deze stap tellen we de vier waarden op die we in stap 2 hebben gevonden.
vul de blanco in.
∑∀X−rijst∀2=som, open verticale lijn, x, minteken, mu, sluit verticale lijn, vierkant, gelijk
[uitleggen]
Stap 4: zoekenNee∑∀X−rijst∀2start kleur #e07d10, begin breuk, som, open verticale lijn, x, minteken, mu, sluit verticale lijn, vierkant, deel door, N, eind breuk, eind kleur #e07d10bestaanNee∑∀X−rijst∀2vierkantswortel van, start kleur #e07d10, start breuk, som, start subscript, eind subscript, start index, eind index, open verticale lijn, x, min, mu, sluit verticale lijn, vierkant, deel, N, eind breuk, einde kleur #e07d10, einde vierkantswortel
In deze stap delen we het resultaat van stap 3 door de variabeleNeeNee, wat het aantal gegevenspunten is.
vul de blanco in.
Nee∑∀X−rijst∀2=Start breuk, som, open balk, x, min, mu, sluit balk, vierkant, delen, N, eind breuk, is gelijk aan
[uitleggen]
Stap 5: Zoek de standaarddeviatieNee∑∀X−rijst∀2vierkantswortel van, start breuk, som, begin subscript, eind subscript, start index, eind index, open verticale lijn, x, minteken, mu, sluit verticale lijn, kwadraat, deel, N, eind breuk, eind vierkantswortel
We zijn bijna klaar! Neem gewoon de vierkantswortel van het antwoord uit stap 4.
vul de blanco in.
Rond je antwoord af op de dichtstbijzijnde centimeter.
SD=Nee∑∀X−rijst∀2≈Starttekst, S, D, Eindtekst, Is gelijk aan, Vierkantswortel, Start Breuk, Som, Startindex, Eindindex, Startindex, Eindindex, Verticale balk openen, x, Minteken, mu, Verticale balk sluiten, Vierkant, Delen Door , N, acral-fractie, acral-vierkantswortel, ca.
[uitleggen]
Ja! We hebben het gedaan! We hebben met succes de standaarddeviatie berekend voor een kleine dataset.
samenvatting van wat we hebben gedaan
We splitsen de formule op in vijf stappen:
stap 1:gemiddeldrijstbestaan.
rijst=46+2+3+1=412=3mu, gelijk, start breuk, 6, plus, 2, plus, 3, plus, 1, delen door, 4, eind breuk, gelijk, begin breuk, 12, gedeeld door, 4, eind breuk, gelijk, start kleur #11accd , 3, eindkleur #11incl
Stap 2:Bereken het kwadraat van de afstand van elk gegevenspunt tot het gemiddelde∀X−rijst∀2verticale lijn openen, x, minteken, mu, verticale lijn sluiten, vierkant.
XX | ∀X−rijst∀2verticale lijn openen, x, minteken, mu, verticale lijn sluiten, vierkant | |
---|---|---|
66 | ∀6−3∀2=32=9Verticale lijn openen, 6, minteken, startkleur #11accd, 3, eindkleur #11accd, verticale lijn sluiten, vierkant, gelijk aan, 3, vierkant, gelijk aan, 9 | |
22 | ∀2−3∀2=12=1Verticale lijn openen, 2, min, startkleur #11accd, 3, eindkleur #11accd, verticale lijn sluiten, vierkant, gelijk aan, 1, vierkant, gelijk aan, 1 | |
33 | ∀3−3∀2=02=0Verticale lijn openen, 3, min, startkleur #11accd, 3, eindkleur #11accd, verticale lijn sluiten, vierkant, gelijk aan, 0, vierkant, gelijk aan, 0 | |
11 | ∀1−3∀2=22=4Verticale lijn openen, 1, min, startkleur #11accd, 3, eindkleur #11accd, verticale lijn sluiten, vierkant, gelijk aan, 2, vierkant, gelijk aan, 4 |
Stappen 3, 4 en 5:
SD=Nee∑∀X−rijst∀2=49+1+0+4=414Tel de kwadraten van deze stand op (stap 3).=3.5Deel door het aantal datapunten (stap 4).≈1.87Neem de vierkantswortel (stap 5).
probeer het zelf
Hier is een herinnering aan de formule:
SD=Nee∑∀X−rijst∀2Starttekst, S, D, Eindtekst, Is gelijk aan, Vierkantswortel, Start Breuk, Som, Startindex, Eindindex, Startindex, Eindindex, Verticale balk openen, x, Minteken, mu, Verticale balk sluiten, Vierkant, Delen Door , N, extreme waarde breuk, extreme waarde vierkantswortel
Hier is een dataset:
1,4,7,2,61 segment 4 segment 7 segment 2 segment 6
Zoek de standaarddeviatie van een dataset.
Rond je antwoord af op de dichtstbijzijnde centimeter.
SD=StartText, S, D, EndText, Equal
[uitleggen]