2.4: Maatregelen van centrale tendens - gemiddelde, mediaan en modus (2023)

  1. laatste update
  2. Opslaan als PDF
  • paginanummer
    26027
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}}}\) \( \newcommand{\vecd}[1]{\overset{-\!- \!\rightharpoonup}{\vphantom{a}\smash{#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{跨度}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart {\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm }[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm { span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\ mathrm {null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{ \ ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \ ( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{ \ unicode[.8,0]{x212B}}\)

    Het "centrum" van een dataset is ook een manier om de locatie te beschrijven. De twee meest gebruikte maten van het "centrum" van gegevens zijnbetekenis is(gemiddeld) enmediaan.berekenenGemiddeld gewicht50 personen, tel de 50 gewichten bij elkaar op en deel door 50. kom opdagengemiddeld gewichtSorteer de gegevens onder de 50 mensen en vind de getallen die de gegevens in twee gelijke delen verdelen. Wanneer er uitschieters of uitbijters zijn, is de mediaan vaak een betere centraliteitsmaat omdat deze niet wordt beïnvloed door de exacte numerieke waarde van de uitbijter. Het gemiddelde is de meest gebruikte maat voor centraliteit.

    De woorden "gemiddeld" en "gemiddeld" worden vaak door elkaar gebruikt. Het ene woord vervangen door het andere is een gangbare praktijk. De technische term is "rekenkundig gemiddelde", en "gemiddelde" is technisch gezien een centrale positie. In de praktijk van niet-statistici wordt 'gemiddelde' echter vaak geaccepteerd als 'rekenkundig gemiddelde'.

    Als elke waarde in de gegevensset niet uniek is, kan het gemiddelde worden berekend door elke afzonderlijke waarde te vermenigvuldigen met de frequentie en vervolgens de som te delen door het totale aantal gegevenswaarden. De letter die wordt gebruikt om het steekproefgemiddelde aan te duiden is een \(x\) met een horizontale balk (uitgesproken als "\(x\) bar"): \(\overline{x}\).

    De Griekse letter \(\mu\) (uitgesproken als "miauw") staat voorgemiddelde bevolking.Een van de eisensteekproef gemiddeldeis een goede schattinggemiddelde bevolkingis een echt willekeurige steekproef.

    Bekijk het voorbeeld om te zien hoe de twee gemiddelden hetzelfde zijn:

    1; 1; 1; 2; 2; 3; 4; 4; 4; 4; 4

    \[\bar{x} = \dfrac{1+1+1+2+2+3+4+4+4+4+4}{11} = 2,7\]

    \[\bar{x} = \dfrac{3(1) + 2(2) + 1(3) + 5(4)}{11} = 2,7\]

    In de tweede berekening zijn de frequenties 3, 2, 1 en 5.

    U kunt snel vinden waar de mediaan is met de uitdrukking

    \[\dfrac{n+1}{2}\]

    De letter \(n\) is het totale aantal gegevenswaarden in de steekproef. Als \(n\) oneven is, is de mediaan de middelste waarde van de gesorteerde gegevens (in oplopende volgorde). Als \(n\) een even getal is, is de mediaan gelijk aan de som van de twee middelste waarden na de gegevensreeks gedeeld door twee. Het totale aantal gegevenswaarden is dan bijvoorbeeld 97

    \[\dfrac{n+1}{2} = \dfrac{97+1}{2} = 49.\]

    De mediaan is 49JijWaarden in geordende gegevens. Als het totale aantal gegevenswaarden 100 is, dan

    \[\dfrac{n+1}{2} = \dfrac{100+1}{2} = 50,5.\]

    De mediaan ligt in het midden van de 50Jijen 51Yingshiwaarde. De positie van de mediaan en de waarde van de mediaan zijnNeedezelfde. De hoofdletter \(M\) wordt vaak gebruikt om de mediaan aan te geven. Het volgende voorbeeld illustreert de locatie van de mediaan en de waarde van de mediaan.

    Voorbeeld \(\PageIndex{1}\)

    De AIDS-cijfers, die het aantal maanden vertegenwoordigen dat een AIDS-patiënt kan leven nadat hij een nieuw antilichaamgeneesmiddel heeft gekregen, zijn als volgt (van kort naar lang):

    3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47

    Bereken het gemiddelde en de mediaan.

    antwoord

    De gemiddelde berekening is:

    \[\bar{x} = \dfrac{[3+4+(8)(2)+10+11+12+13+14+(15)(2)+(16)(2)+... +35+37+40+(44)(2)+47]}{40} = 23,6\]

    Gebruik eerst de locusformule om de mediaan \(M\) te vinden. De locatie is:

    \[\dfrac{n+1}{2} = \dfrac{40+1}{2} = 20,5\]

    Begin met de kleinste waarde, de mediaan ligt tussen de 20Jijen 21YingshiPrijzen (beide voor 24 seconden):

    3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47

    \[M = \dfrac{24+24}{2} = 24\]

    Voorbeeld \(\PageIndex{2}\)

    Stel dat in een kleine stad van 50 mensen, één $ 5.000.000 per jaar verdient en 49 $ 30.000 elk. Wat is een betere maatstaf voor "centrum": gemiddelde of mediaan?

    oplossing

    \[\bar{x} = \dfrac{5.000.000+49(30.000)}{50} = 129.400\]

    \(M = 30.000\)

    (Er zijn 49 mensen die $ 30.000 verdienen en 1 verdient $ 5.000.000.)

    De mediaan is een betere maatstaf voor "centrum" dan het gemiddelde, omdat 49 van de waarden 30.000 zijn en één 5.000.000. 5.000.000 is extreem. 30.000 geeft ons een beter idee van het gemiddelde van de gegevens.

    Een andere maatstaf voor het centrum is functionaliteit. ditManieris de meest voorkomende waarde. Er kan meer dan één patroon in de dataset zitten, zolang die waarden maar dezelfde frequentie hebben en die frequentie het hoogst is. Een dataset met twee modi wordt bimodaal genoemd.

    Voorbeeld \(\PageIndex{3}\)

    De toetsresultaten van de 20 studenten zijn als volgt:

    50; 53; 59; 59; 63; 63; 72; 72; 72; 72; 72; 76; 78; 81; 83; 84; 84; 84; 90; 93

    Zoek de functie.

    antwoord

    De meest voorkomende score is 72, die vijf keer voorkomt. functie = 72.= 7.

    Voorbeeld \(\PageIndex{4}\)

    De vijf vastgoedexamenscores zijn 430, 430, 480, 480, 495. De dataset is bimodaal omdat de scores 430 en 480 twee keer voorkomen.

    Wanneer is modus de beste maatstaf voor "centrum"? Overweeg een programma voor gewichtsverlies dat reclame maakt voor een gemiddeld gewichtsverlies van 6 pond binnen de eerste week van het programma. De functie zou kunnen aangeven dat de meeste mensen in de eerste week twee pond zijn afgevallen, waardoor het programma minder aantrekkelijk wordt.

    Bedrijfsmodi kunnen worden berekend voor zowel kwalitatieve als kwantitatieve gegevens. Als de dataset bijvoorbeeld is: rood, rood, rood, groen, groen, geel, paars, zwart, blauw, dan is de functie rood.

    Statistische software berekent eenvoudig het gemiddelde, de mediaan en de modus. Sommige grafische rekenmachines kunnen deze berekeningen ook uitvoeren. In de echte wereld gebruiken mensen software om deze berekeningen te maken.

    wet van grote getallen en gemiddelden

    De wet van de grote getallen zegt dat als je steeds grotere steekproeven neemt uit een willekeurige populatie, het steekproefgemiddelde \(\bar{x}\) waarschijnlijk steeds dichter bij \(\mu\) komt te liggen. Dit wordt verderop in dit artikel in meer detail besproken.

    Statistieken over steekproefverdelingen en steekproefverdelingen

    je kunt er een bedenkenbemonsteringleuk vindenrelatieve frequentieverdelingEr zijn veel voorbeelden. (Ik begrijpBemonstering en gegevensBekijk relatieve frequentie). Stel dat aan 30 willekeurig gekozen leerlingen wordt gevraagd hoeveel films ze de afgelopen week hebben gezien. resulteren inrelatieve frequentietabelzie hieronder.

    # Film relatieve frequentie
    0

    \(\dfrac{5}{30}\)

    1

    \(\dfrac{15}{30}\)

    2

    \(\dfrac{6}{30}\)

    3

    \(\dfrac{3}{30}\)

    4

    \(\dfrac{1}{30}\)

    Als u de steekproefomvang te groot maakt (zoals 300 miljoen of meer), wordt de relatieve frequentietabel een relatieve frequentieverdeling.

    Een statistiek is een getal berekend op basis van een steekproef. Voorbeelden van statistieken zijn onder andere het gemiddelde, de mediaan en de modus. Het steekproefgemiddelde \(\bar{x}\) is een voorbeeldstatistiek voor het schatten van het populatiegemiddelde \(\mu\).

    Bereken het gemiddelde van een gegroepeerde frequentietabel

    Wanneer er alleen gegroepeerde gegevens beschikbaar zijn, kent u de individuele gegevenswaarden niet (we kennen alleen intervallen en intervalfrequenties). Daarom kunt u het exacte gemiddelde van de dataset niet berekenen. Wat we moeten doen, is het werkelijke gemiddelde berekenen door de frequentietabel te middelen. Een frequentietabel is een weergave van gegevens die gegroepeerde gegevens en hun bijbehorende frequenties toont. Om het gemiddelde uit een gegroepeerde frequentietabel te berekenen, kunnen we de basisdefinitie van het gemiddelde toepassen:

    \[mean = \dfrac{\text{som van gegevens}}{\text{aantal gegevenswaarden}}. \]

    We hoeven alleen de definitie aan te passen om tegemoet te komen aan de beperkingen van de frequentietabel.

    Omdat we de individuele gegevenswaarden niet kennen, kunnen we het gemiddelde voor elk interval vinden. het midden is

    \[\dfrac{\text{Ondergrens + bovengrens}}{2}. \]

    We kunnen nu de definitie van betekenen om te wijzigen

    \[\text{Gemiddelde frequentietabel} = \dfrac{\sum{fm}}{\sum{f}}\]

    waarbij \(f\) de frequentie van het interval is en \(m\) het gemiddelde van het interval.

    Voorbeeld \(\PageIndex{5}\)

    De weergegeven frequentietabel toont de meest recente statistische test van professor Blount. Vind de beste schatting van het categoriegemiddelde.

    graden interval aantal leerlingen
    50-56,5 1
    56,5–62,5 0
    62,5–68,5 4
    68,5–74,5 4
    74,5–80,5 2
    80,5–86,5 3
    86,5–92,5 4
    92,5–98,5 1

    oplossing

    • Zoek het gemiddelde van alle intervallen
    graden interval middelpunt
    50-56,5 53,25
    56,5–62,5 59,5
    62,5–68,5 65,5
    68,5–74,5 71,5
    74,5–80,5 77,5
    80,5–86,5 83,5
    86,5–92,5 89,5
    92,5–98,5 95,5
    • Berekent de som van de producten van elke bin-frequentie maal het middelpunt. \(\som{fm} 53,25(1) + 59,5(0) + 65,5(4 )+ 71,5(4) + 77,5(2) + 83,5(3) + 89,5(4) + 95,5(1) = 1460,25 \)
    • \(\mu = \dfrac{\sum{fm}}{\sum{f}} = \dfrac{1460,25}{19} = 76,86\)

    ons werkprobleem

    Zoekopdracht \(\PageIndex{1}\)

    Vraag \(\PageIndex{2}\)

    Vraag \(\PageIndex{3}\)

    Vraag \(\PageIndex{4}\)

    Vraag \(\PageIndex{5}\)

    Vraag \(\PageIndex{6}\)

    Vraag \(\PageIndex{7}\)

    bibliografie

    1. Gegevens van de Wereldbank, online beschikbaar ophttp://www.worldbank.org(Toegankelijk op 3 april 2013).
    2. "Demografie: obesitas - prevalentie bij volwassenen". Indexmundi. beschikbaar onlinehttp://www.indexmundi.com/g/r.aspx?t=50&v=2228&l=el(Toegankelijk op 3 april 2013).

    beoordeling

    Het gemiddelde en de mediaan kunnen worden berekend om u te helpen het "centrum" van uw dataset te vinden. Het gemiddelde is de beste schatting voor een echte dataset, maar de mediaan is de beste maat wanneer de dataset veel uitschieters of uitschieters bevat. Deze functie brengt u op de hoogte van de meest voorkomende gegevens (of gegevens) in de dataset. Het gemiddelde, de mediaan en de modus zijn erg handig wanneer u gegevens moet analyseren, maar als uw dataset bereiken bevat zonder specifieke waarden, lijkt het onmogelijk om het gemiddelde te berekenen. Het gemiddelde kan echter worden benaderd door de onder- en bovengrenzen op te tellen en door twee te delen om de mediaan van elk interval te vinden. Vermenigvuldig elk gemiddelde met het aantal gevonden waarden in het overeenkomstige bereik. Deel de som van deze waarden door het totale aantal gegevenswaarden in de verzameling.

    formule review

    \[\mu = \dfrac{\sum{fm}}{\sum{f}} \]

    waarbij \(f\) = intervalfrequentie en \(m\) = intervalmidden.

    Woordenlijst

    Frequentietabel
    Een gegevensrepresentatie die gegroepeerde gegevens met overeenkomstige frequenties weergeeft
    betekenis is
    Een getal dat de centrale tendens van de gegevens meet. De gebruikelijke naam voor het gemiddelde is "gemiddeld". De term "gemiddelde" is een verkorte vorm van "rekenkundig gemiddelde". Per definitie is het gemiddelde van een steekproef (aangegeven met \(\bar{x}\)) \(\bar{x} = \dfrac{\text{de som van alle waarden in de steekproef}}{\ tekst {de som van de waarden in het steekproefnummer}}\), en het gemiddelde van de populatie (aangegeven met \(\mu\)) is \(\mu = \dfrac{\text{de som van alle waarden in de steekproefpopulatie}}{\text{populatie mediaan aantal}}\).
    mediaan
    Een getal dat de gesorteerde gegevens in tweeën splitst. De helft van de waarden is gelijk aan of kleiner dan de mediaan en de helft van de waarden is gelijk aan of groter dan de mediaan. De mediaan kan al dan niet deel uitmaken van de gegevens.
    middelpunt
    gemiddelde van intervallen in frequentietabel
    Manier
    De meest voorkomende waarde in de dataset

    Bijdragen en referenties

    References

    Top Articles
    Latest Posts
    Article information

    Author: Virgilio Hermann JD

    Last Updated: 17/08/2023

    Views: 5787

    Rating: 4 / 5 (41 voted)

    Reviews: 88% of readers found this page helpful

    Author information

    Name: Virgilio Hermann JD

    Birthday: 1997-12-21

    Address: 6946 Schoen Cove, Sipesshire, MO 55944

    Phone: +3763365785260

    Job: Accounting Engineer

    Hobby: Web surfing, Rafting, Dowsing, Stand-up comedy, Ghost hunting, Swimming, Amateur radio

    Introduction: My name is Virgilio Hermann JD, I am a fine, gifted, beautiful, encouraging, kind, talented, zealous person who loves writing and wants to share my knowledge and understanding with you.