Објашњење, апликације и примјери правила
Тхе Стургес руле је критеријум који се користи за одређивање броја класа или интервала који су неопходни за графички приказ скупа статистичких података. Ово правило је 1926. године објавио њемачки математичар Херберт Стургес.
Стургес је предложио једноставан метод, заснован на броју узорака к који су омогућили проналажење броја класа и њихове амплитуде распона. Правило Стургес се широко користи посебно у области статистике, посебно за изградњу фреквентних хистограма.
Индек
- 1 Објашњење
- 2 Апплицатионс
- 3 Пример
- 4 Референце
Објашњење
Правило Стургес је емпиријска метода која се широко користи у дескриптивној статистици како би се одредио број класа које морају постојати у хистограму фреквенције, како би се класификовао скуп података који представљају узорак или популацију.
У основи, ово правило одређује ширину графичких контејнера, фреквентне хистограме.
Да би успоставио своје правило, Херберт Стургес је разматрао идеалан дијаграм фреквенције, који се састоји од К интервала, где и-ти интервал садржи одређени број узорака (и = 0, ... к - 1), представљених као:
Тај број узорака се даје бројем начина на који се подскуп скупа може издвојити; то јест, по биномном коефицијенту, изражено на следећи начин:
Да би се поједноставио израз, применио је особине логаритама у оба дела једначине:
Тако је Стургес установио да је оптимални број интервала к даним изразом:
Може се изразити и као:
У овом изразу:
- к је број класа.
- Н је укупан број опажања узорка.
- Лог је заједнички логаритам базе 10.
На пример, да бисте направили хистограм фреквенције који изражава случајни узорак висине од 142 деце, број интервала или класа које ће дистрибуција имати је:
к = 1 + 3,322 * лог10 (Н)
к = 1 + 3,322* лог (142) \ т
к = 1 + 3,322* 2,1523
к = 8,14 ≈ 8
Дакле, дистрибуција ће бити у 8 интервала.
Број интервала увек треба да буде представљен бројевима. У случајевима када је вредност децимална, мора се извршити апроксимација најближег целог броја.
Апплицатионс
Правило Стургес се примењује углавном у статистици, јер дозвољава да се расподели фреквенције кроз израчунавање броја класа (к), као и дужину сваке од њих, познату и као амплитуда..
Амплитуда је разлика између горње и доње границе класе, подијељена бројем класа, и изражава се:
Постоје многа емпиријска правила која дозвољавају дистрибуцију фреквенција. Међутим, правило Стургес се обично користи зато што је приближан број класа, који се обично креће од 5 до 15.
На тај начин размотрите вриједност која адекватно представља узорак или популацију; то јест, апроксимација не представља екстремне групације, нити ради са превеликим бројем класа које не дозвољавају сумирање узорка.
Пример
Потребно је извести фреквентни хистограм према датим подацима, који одговара старости добијеној у анкети мушкараца који раде вежбе у локалној теретани..
Да бисте одредили интервале, морате знати која је величина узорка или број запажања; у овом случају имате 30.
Онда се примењује правило Стургес:
к = 1 + 3,322 * лог10 (Н)
к = 1 + 3,322* лог (30) \ т
к = 1 + 3,322* 1,4771
к = 5,90 ≈ 6 интервала.
Из броја интервала може се израчунати амплитуда коју ће имати; то јест, ширина сваке траке представљене у хистограму фреквенције:
Доња граница се сматра најнижом вредношћу података, а горња граница је највећа вредност. Разлика између горње и доње границе назива се опсег или путања променљиве (Р).
Из табеле имамо да је горња граница 46 и доња граница 13; на тај начин, амплитуда сваке класе ће бити:
Интервали ће бити састављени од горње и доње границе. Да бисте одредили ове интервале, почните да рачунате од доње границе, додајући јој амплитуду одређену правилом (6), као што следи:
Тада се израчунава апсолутна фреквенција за одређивање броја мушкараца који одговарају сваком интервалу; у овом случају то је:
- Интервал 1: 13 - 18 = 9
- Интервал 2: 19 - 24 = 9
- Интервал 3: 25 - 30 = 5
- Интервал 4: 31 - 36 = 2
- Интервал 5: 37 - 42 = 2
- Интервал 6: 43 - 48 = 3
Када се додаје апсолутна фреквенција за сваку класу, она мора бити једнака укупном броју узорка; у овом случају, 30.
Након тога се израчунава релативна учесталост сваког интервала, делећи апсолутну фреквенцију овог интервала укупним бројем опсервација:
- Интервал 1: фи = 9 = 30 = 0.30
- Интервал 2: фи = 9 = 30 = 0.30
- Интервал 3: фи = 5 = 30 = 0,1666
- Интервал 4: фи = 2 = 30 = 0.0666
- Интервал 5: фи = 2 = 30 = 0.0666
- Интервал 4: фи = 3 = 30 = 0.10
Тада можете направити табелу која одражава податке, као и дијаграм из релативне фреквенције у односу на добијене интервале, као што се може видети на следећим сликама:
На тај начин, правило Стургес омогућава одређивање броја класа или интервала у којима се узорак може поделити, како би се сумирао узорак података кроз припрему табела и графова..
Референце
- Алфонсо Уркуиа, М. В. (2013). Моделовање и симулација дискретних догађаја. УНЕД,.
- Алтман Наоми, М. К. (2015). "Једноставна линеарна регресија." Природне методе .
- Антунез, Р. Ј. (2014). Статистика у образовању. Дигитал УНИД.
- Фок, Ј. (1997.). Примењена регресиона анализа, линеарни модели и сродне методе. Публикације САГЕ.
- Хумберто Ллинас Солано, Ц.Р. (2005). Дескриптивна статистика и дистрибуција вероватноће. Универзитет на северу.
- Пантелејева, О. В. (2005). Основе вјероватноће и статистике.
- О. Куехл, М. О. (2001). Дизајн експеримената: статистички принципи дизајна и анализе истраживања. Тхомсон Едиторс.