- laatste update
- Opslaan als PDF
- paginanummer
- 26027
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}}}\) \( \newcommand{\vecd}[1]{\overset{-\!- \!\rightharpoonup}{\vphantom{a}\smash{#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{跨度}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart {\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm }[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm { span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\ mathrm {null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{ \ ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \ ( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{ \ unicode[.8,0]{x212B}}\)
Het "centrum" van een dataset is ook een manier om de locatie te beschrijven. De twee meest gebruikte maten van het "centrum" van gegevens zijnbetekenis is(gemiddeld) enmediaan.berekenenGemiddeld gewicht50 personen, tel de 50 gewichten bij elkaar op en deel door 50. kom opdagengemiddeld gewichtSorteer de gegevens onder de 50 mensen en vind de getallen die de gegevens in twee gelijke delen verdelen. Wanneer er uitschieters of uitbijters zijn, is de mediaan vaak een betere centraliteitsmaat omdat deze niet wordt beïnvloed door de exacte numerieke waarde van de uitbijter. Het gemiddelde is de meest gebruikte maat voor centraliteit.
De woorden "gemiddeld" en "gemiddeld" worden vaak door elkaar gebruikt. Het ene woord vervangen door het andere is een gangbare praktijk. De technische term is "rekenkundig gemiddelde", en "gemiddelde" is technisch gezien een centrale positie. In de praktijk van niet-statistici wordt 'gemiddelde' echter vaak geaccepteerd als 'rekenkundig gemiddelde'.
Als elke waarde in de gegevensset niet uniek is, kan het gemiddelde worden berekend door elke afzonderlijke waarde te vermenigvuldigen met de frequentie en vervolgens de som te delen door het totale aantal gegevenswaarden. De letter die wordt gebruikt om het steekproefgemiddelde aan te duiden is een \(x\) met een horizontale balk (uitgesproken als "\(x\) bar"): \(\overline{x}\).
De Griekse letter \(\mu\) (uitgesproken als "miauw") staat voorgemiddelde bevolking.Een van de eisensteekproef gemiddeldeis een goede schattinggemiddelde bevolkingis een echt willekeurige steekproef.
Bekijk het voorbeeld om te zien hoe de twee gemiddelden hetzelfde zijn:
1; 1; 1; 2; 2; 3; 4; 4; 4; 4; 4
\[\bar{x} = \dfrac{1+1+1+2+2+3+4+4+4+4+4}{11} = 2,7\]
\[\bar{x} = \dfrac{3(1) + 2(2) + 1(3) + 5(4)}{11} = 2,7\]
In de tweede berekening zijn de frequenties 3, 2, 1 en 5.
U kunt snel vinden waar de mediaan is met de uitdrukking
\[\dfrac{n+1}{2}\]
De letter \(n\) is het totale aantal gegevenswaarden in de steekproef. Als \(n\) oneven is, is de mediaan de middelste waarde van de gesorteerde gegevens (in oplopende volgorde). Als \(n\) een even getal is, is de mediaan gelijk aan de som van de twee middelste waarden na de gegevensreeks gedeeld door twee. Het totale aantal gegevenswaarden is dan bijvoorbeeld 97
\[\dfrac{n+1}{2} = \dfrac{97+1}{2} = 49.\]
De mediaan is 49JijWaarden in geordende gegevens. Als het totale aantal gegevenswaarden 100 is, dan
\[\dfrac{n+1}{2} = \dfrac{100+1}{2} = 50,5.\]
De mediaan ligt in het midden van de 50Jijen 51Yingshiwaarde. De positie van de mediaan en de waarde van de mediaan zijnNeedezelfde. De hoofdletter \(M\) wordt vaak gebruikt om de mediaan aan te geven. Het volgende voorbeeld illustreert de locatie van de mediaan en de waarde van de mediaan.
Voorbeeld \(\PageIndex{1}\)
De AIDS-cijfers, die het aantal maanden vertegenwoordigen dat een AIDS-patiënt kan leven nadat hij een nieuw antilichaamgeneesmiddel heeft gekregen, zijn als volgt (van kort naar lang):
3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47
Bereken het gemiddelde en de mediaan.
antwoord
De gemiddelde berekening is:
\[\bar{x} = \dfrac{[3+4+(8)(2)+10+11+12+13+14+(15)(2)+(16)(2)+... +35+37+40+(44)(2)+47]}{40} = 23,6\]
Gebruik eerst de locusformule om de mediaan \(M\) te vinden. De locatie is:
\[\dfrac{n+1}{2} = \dfrac{40+1}{2} = 20,5\]
Begin met de kleinste waarde, de mediaan ligt tussen de 20Jijen 21YingshiPrijzen (beide voor 24 seconden):
3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47
\[M = \dfrac{24+24}{2} = 24\]
Voorbeeld \(\PageIndex{2}\)
Stel dat in een kleine stad van 50 mensen, één $ 5.000.000 per jaar verdient en 49 $ 30.000 elk. Wat is een betere maatstaf voor "centrum": gemiddelde of mediaan?
oplossing
\[\bar{x} = \dfrac{5.000.000+49(30.000)}{50} = 129.400\]
\(M = 30.000\)
(Er zijn 49 mensen die $ 30.000 verdienen en 1 verdient $ 5.000.000.)
De mediaan is een betere maatstaf voor "centrum" dan het gemiddelde, omdat 49 van de waarden 30.000 zijn en één 5.000.000. 5.000.000 is extreem. 30.000 geeft ons een beter idee van het gemiddelde van de gegevens.
Een andere maatstaf voor het centrum is functionaliteit. ditManieris de meest voorkomende waarde. Er kan meer dan één patroon in de dataset zitten, zolang die waarden maar dezelfde frequentie hebben en die frequentie het hoogst is. Een dataset met twee modi wordt bimodaal genoemd.
Voorbeeld \(\PageIndex{3}\)
De toetsresultaten van de 20 studenten zijn als volgt:
50; 53; 59; 59; 63; 63; 72; 72; 72; 72; 72; 76; 78; 81; 83; 84; 84; 84; 90; 93
Zoek de functie.
antwoord
De meest voorkomende score is 72, die vijf keer voorkomt. functie = 72.= 7.
Voorbeeld \(\PageIndex{4}\)
De vijf vastgoedexamenscores zijn 430, 430, 480, 480, 495. De dataset is bimodaal omdat de scores 430 en 480 twee keer voorkomen.
Wanneer is modus de beste maatstaf voor "centrum"? Overweeg een programma voor gewichtsverlies dat reclame maakt voor een gemiddeld gewichtsverlies van 6 pond binnen de eerste week van het programma. De functie zou kunnen aangeven dat de meeste mensen in de eerste week twee pond zijn afgevallen, waardoor het programma minder aantrekkelijk wordt.
Bedrijfsmodi kunnen worden berekend voor zowel kwalitatieve als kwantitatieve gegevens. Als de dataset bijvoorbeeld is: rood, rood, rood, groen, groen, geel, paars, zwart, blauw, dan is de functie rood.
Statistische software berekent eenvoudig het gemiddelde, de mediaan en de modus. Sommige grafische rekenmachines kunnen deze berekeningen ook uitvoeren. In de echte wereld gebruiken mensen software om deze berekeningen te maken.
wet van grote getallen en gemiddelden
De wet van de grote getallen zegt dat als je steeds grotere steekproeven neemt uit een willekeurige populatie, het steekproefgemiddelde \(\bar{x}\) waarschijnlijk steeds dichter bij \(\mu\) komt te liggen. Dit wordt verderop in dit artikel in meer detail besproken.
Statistieken over steekproefverdelingen en steekproefverdelingen
je kunt er een bedenkenbemonsteringleuk vindenrelatieve frequentieverdelingEr zijn veel voorbeelden. (Ik begrijpBemonstering en gegevensBekijk relatieve frequentie). Stel dat aan 30 willekeurig gekozen leerlingen wordt gevraagd hoeveel films ze de afgelopen week hebben gezien. resulteren inrelatieve frequentietabelzie hieronder.
# Film | relatieve frequentie |
---|---|
0 | \(\dfrac{5}{30}\) |
1 | \(\dfrac{15}{30}\) |
2 | \(\dfrac{6}{30}\) |
3 | \(\dfrac{3}{30}\) |
4 | \(\dfrac{1}{30}\) |
Als u de steekproefomvang te groot maakt (zoals 300 miljoen of meer), wordt de relatieve frequentietabel een relatieve frequentieverdeling.
Een statistiek is een getal berekend op basis van een steekproef. Voorbeelden van statistieken zijn onder andere het gemiddelde, de mediaan en de modus. Het steekproefgemiddelde \(\bar{x}\) is een voorbeeldstatistiek voor het schatten van het populatiegemiddelde \(\mu\).
Bereken het gemiddelde van een gegroepeerde frequentietabel
Wanneer er alleen gegroepeerde gegevens beschikbaar zijn, kent u de individuele gegevenswaarden niet (we kennen alleen intervallen en intervalfrequenties). Daarom kunt u het exacte gemiddelde van de dataset niet berekenen. Wat we moeten doen, is het werkelijke gemiddelde berekenen door de frequentietabel te middelen. Een frequentietabel is een weergave van gegevens die gegroepeerde gegevens en hun bijbehorende frequenties toont. Om het gemiddelde uit een gegroepeerde frequentietabel te berekenen, kunnen we de basisdefinitie van het gemiddelde toepassen:
\[mean = \dfrac{\text{som van gegevens}}{\text{aantal gegevenswaarden}}. \]
We hoeven alleen de definitie aan te passen om tegemoet te komen aan de beperkingen van de frequentietabel.
Omdat we de individuele gegevenswaarden niet kennen, kunnen we het gemiddelde voor elk interval vinden. het midden is
\[\dfrac{\text{Ondergrens + bovengrens}}{2}. \]
We kunnen nu de definitie van betekenen om te wijzigen
\[\text{Gemiddelde frequentietabel} = \dfrac{\sum{fm}}{\sum{f}}\]
waarbij \(f\) de frequentie van het interval is en \(m\) het gemiddelde van het interval.
Voorbeeld \(\PageIndex{5}\)
De weergegeven frequentietabel toont de meest recente statistische test van professor Blount. Vind de beste schatting van het categoriegemiddelde.
graden interval | aantal leerlingen |
---|---|
50-56,5 | 1 |
56,5–62,5 | 0 |
62,5–68,5 | 4 |
68,5–74,5 | 4 |
74,5–80,5 | 2 |
80,5–86,5 | 3 |
86,5–92,5 | 4 |
92,5–98,5 | 1 |
oplossing
- Zoek het gemiddelde van alle intervallen
graden interval | middelpunt |
---|---|
50-56,5 | 53,25 |
56,5–62,5 | 59,5 |
62,5–68,5 | 65,5 |
68,5–74,5 | 71,5 |
74,5–80,5 | 77,5 |
80,5–86,5 | 83,5 |
86,5–92,5 | 89,5 |
92,5–98,5 | 95,5 |
- Berekent de som van de producten van elke bin-frequentie maal het middelpunt. \(\som{fm} 53,25(1) + 59,5(0) + 65,5(4 )+ 71,5(4) + 77,5(2) + 83,5(3) + 89,5(4) + 95,5(1) = 1460,25 \)
- \(\mu = \dfrac{\sum{fm}}{\sum{f}} = \dfrac{1460,25}{19} = 76,86\)
ons werkprobleem
Zoekopdracht \(\PageIndex{1}\)
Vraag \(\PageIndex{2}\)
Vraag \(\PageIndex{3}\)
Vraag \(\PageIndex{4}\)
Vraag \(\PageIndex{5}\)
Vraag \(\PageIndex{6}\)
Vraag \(\PageIndex{7}\)
bibliografie
- Gegevens van de Wereldbank, online beschikbaar ophttp://www.worldbank.org(Toegankelijk op 3 april 2013).
- "Demografie: obesitas - prevalentie bij volwassenen". Indexmundi. beschikbaar onlinehttp://www.indexmundi.com/g/r.aspx?t=50&v=2228&l=el(Toegankelijk op 3 april 2013).
beoordeling
Het gemiddelde en de mediaan kunnen worden berekend om u te helpen het "centrum" van uw dataset te vinden. Het gemiddelde is de beste schatting voor een echte dataset, maar de mediaan is de beste maat wanneer de dataset veel uitschieters of uitschieters bevat. Deze functie brengt u op de hoogte van de meest voorkomende gegevens (of gegevens) in de dataset. Het gemiddelde, de mediaan en de modus zijn erg handig wanneer u gegevens moet analyseren, maar als uw dataset bereiken bevat zonder specifieke waarden, lijkt het onmogelijk om het gemiddelde te berekenen. Het gemiddelde kan echter worden benaderd door de onder- en bovengrenzen op te tellen en door twee te delen om de mediaan van elk interval te vinden. Vermenigvuldig elk gemiddelde met het aantal gevonden waarden in het overeenkomstige bereik. Deel de som van deze waarden door het totale aantal gegevenswaarden in de verzameling.
formule review
\[\mu = \dfrac{\sum{fm}}{\sum{f}} \]
waarbij \(f\) = intervalfrequentie en \(m\) = intervalmidden.
Woordenlijst
- Frequentietabel
- Een gegevensrepresentatie die gegroepeerde gegevens met overeenkomstige frequenties weergeeft
- betekenis is
- Een getal dat de centrale tendens van de gegevens meet. De gebruikelijke naam voor het gemiddelde is "gemiddeld". De term "gemiddelde" is een verkorte vorm van "rekenkundig gemiddelde". Per definitie is het gemiddelde van een steekproef (aangegeven met \(\bar{x}\)) \(\bar{x} = \dfrac{\text{de som van alle waarden in de steekproef}}{\ tekst {de som van de waarden in het steekproefnummer}}\), en het gemiddelde van de populatie (aangegeven met \(\mu\)) is \(\mu = \dfrac{\text{de som van alle waarden in de steekproefpopulatie}}{\text{populatie mediaan aantal}}\).
- mediaan
- Een getal dat de gesorteerde gegevens in tweeën splitst. De helft van de waarden is gelijk aan of kleiner dan de mediaan en de helft van de waarden is gelijk aan of groter dan de mediaan. De mediaan kan al dan niet deel uitmaken van de gegevens.
- middelpunt
- gemiddelde van intervallen in frequentietabel
- Manier
- De meest voorkomende waarde in de dataset
Bijdragen en referenties
Barbara Illowsky en Susan Dean (De Anza College) en vele andere medewerkers. geproduceerde inhoudStax Academie openenGelicenseerd onder de Creative Commons Attribution License 4.0. gratis downloadhttp://cnx.org/contents/30189442-699...b91b9de@18.114.