Средишње мјере тренда за групиране податке
Тхе мере централне тенденције груписаних података користе се у статистици за описивање одређених понашања групе достављених података, као што су оно што им је близу, колико је просјек прикупљених података, између осталог.
Када се узме велика количина података, корисно је груписати их да имају бољи редослед и на тај начин бити у стању да израчунају одређене мере централне тенденције.
Међу најчешће коришћеним мерама централне тенденције су аритметичка средина, медијана и режим. Ови бројеви говоре одређене квалитете о подацима прикупљеним у одређеном експерименту.
Да би се користиле ове мере потребно је прво знати како груписати скуп података.
Груписани подаци
За груписање података прво морате израчунати опсег података, који се добија одузимањем највише вредности минус најниже вредности података.
Затим изаберите број "к", који је број класа у којима желите груписати податке.
Настављамо да поделимо опсег између "к" да бисмо добили амплитуду класа које треба да се групишу. Овај број је Ц = Р / к.
Коначно се започиње групирање, за које се бира мањи број од најмање вриједности добивених података..
Овај број ће бити доња граница прве класе. Овоме се додаје Ц. Добијена вредност ће бити горња граница прве класе.
Тада се овој вриједности додаје Ц и добије се горња граница друге класе. На овај начин настављате док не добијете горњу границу задње класе.
Након груписања података можете наставити са израчунавањем средње вредности, медијана и мода.
Да бисмо илустровали како се рачунају аритметичка средина, медијана и мод, наставићемо са примером.
Пример
Стога, када груписате податке добићете табелу као што је следеће:
Три главне мјере централне тенденције
Сада ћемо наставити са израчунавањем аритметичке средине, медијана и мода. Горњи примјер ће се користити за илустрацију ове процедуре.
1 - Аритметичка средина
Аритметичка средина се састоји од множења сваке фреквенције са просеком интервала. Затим се сви ови резултати додају, и на крају поделе са укупним подацима.
Користећи претходни пример, добили бисмо да је аритметичка средина једнака:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111
Ово указује да је просечна вредност података у табели 5.11111.
2- Медиум
Да би се израчунао медијан скупа података, прво се наручују сви подаци од најмање до највећег. Могу се представити два случаја:
- Ако је број података непаран, онда је медијана податак који је у самом центру.
- Ако је број података паран, онда је медијан просјек два податка који остају у центру.
Када се ради о груписаним подацима, израчунавање медијана се врши на следећи начин:
- Н / 2 се израчунава, где је Н укупни податак.
- Претражује се први интервал где је акумулирана фреквенција (збир фреквенција) већа од Н / 2, а изабрана је доња граница овог интервала, названа Ли..
Медијана је дата следећом формулом:
Ме = Ли + (Лс-Ли) * (Н / 2 - Акумулирана фреквенција пре Ли) / Фреквенција [Ли, Лс]
Лс је горња граница горе наведеног распона.
Ако се користи горња табела података, имамо Н / 2 = 18/2 = 9. Акумулиране фреквенције су 4, 8, 14 и 18 (једна за сваки ред табеле).
Стога треба одабрати трећи интервал, јер је акумулирана фреквенција већа од Н / 2 = 9.
Ли = 5 и Лс = 7. Примјењујући горе описану формулу, морате:
Ме = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Фасхион
Мода је вриједност која има највише фреквенција међу свим групираним подацима; то јест, то је вредност која се понавља највише пута у почетном скупу података.
Када имате веома велику количину података, следећа формула се користи за израчунавање начина груписања података:
Мо = Ли + (Лс-Ли) * (Ли фреквенција - Фреквенција Л (и-1)) / ((фреквенција Ли-фреквенције Л (и-1)) + (фреквенција Ли-фреквенције Л ( и + 1)))
Интервал [Ли, Лс) је интервал у којем се налази највећа фреквенција. За пример који је израђен у овом чланку ми имамо тај начин дајемо:
Мо = 5 + (7-5) * (6-4) / ((6-4) + (6-4) = 5 + 2 * 2/4 = 5 + 1 = 6.
Друга формула која се користи за добијање приближне вредности за моду је следећа:
Мо = Ли + (Лс-Ли) * (фреквенција Л (и + 1)) / (фреквенција Л (и-1) + фреквенција Л (и + 1)).
Са овом формулом, рачуни су следећи:
Мо = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Референце
- Беллхоусе, Д.Р. (2011). Абрахам Де Моивре: Постављање позорнице за класичну вјероватноћу и њене примјене. ЦРЦ Пресс.
- Цифуентес, Ј. Ф. (2002). Увод у теорију вероватноће. Натионал оф Цоломбиа.
- Дастон, Л. (1995). Класична вероватноћа у просветитељству. Принцетон Университи Пресс.
- Ларсон, Х. Ј. (1978). Увод у теорију вероватноће и статистички закључак. Едиториал Лимуса.
- Мартел, П.Ј., & Вегас, Ф.Ј. (1996). Вјероватноћа и математичка статистика: примјене у клиничкој пракси и здравственом управљању. Едиционес Диаз де Сантос.
- Вазкуез, А.Л., & Ортиз, Ф.Ј. (2005). Статистичке методе за мјерење, описивање и контролу варијабилности. Ед Университи оф Цантабриа.
- Вазкуез, С.Г. (2009). Приручник за математику за приступ Универзитету. Уреднички центар за студије Рамон Арецес СА.