SHPORA.net :: PDA

Login:
регистрация

Main
FAQ

гуманитарные науки
естественные науки
математические науки
технические науки
Search:
Title: | Body:

Статистическое распределение и его смысл. Огива и кумулята. Плотность распределения. Медиана, квартили, мода распределения. Графическое определение моды и медианы


Статистическая информация в графическом виде может быть представлена в виде ряда накопленных частот (кумуляты), о котором уже шла речь выше.

Для построения кумуляты по оси ординат следует отложить накопленные частоты (см. таблицу распределения семей по размеру жилой площади, приходящейся на одного человека), а по оси абсцисс значения правой границы соответствующего интервала вариационного ряда.

Смысл кумулянтной кривой состоит в том, что точка на графике (например, точка 30) показывает, сколько членов статистической совокупности имеет значение вариационного признака меньшее или равное, отмеченному на графике (30 тысяч семей имеют жилую площадь 7 м2 и менее в расчете на одного члена семьи).

Возможно представление статистической информации и в виде огивы.

Для получения кривой огивы, ряд накопленных частот следует отсортировать по убыванию и отложить эти значения по оси ординат.

По оси абсцисс нужно отложить нижнюю границу интервала вариационного признака.

Плотность распределения

Наряду с частотой индивидуального признака в вариационном ряду широко используется понятие частости. Еще раз напомним понятие частости.

Частостью i-го значения признака в сгруппированном вариационном ряду называется отношение частоты к полному числу членов ряда n: . Естественно, что частости в силу своего определения удовлетворяют равенству



Еще одной формой представления вариационного ряда является ряд накопленных частот. Вариационный ряд, представленный в виде ряда накопленных частот, называют кумулятивным распределением. Для графического построения кумулятивного распределения по оси абсцисс необходимо откладывать значения признака xi, а по оси ординат ? накопленные частоты (подробнее см. тему 3):

.

Следовательно, ряд накопленных частот показывает, сколько единиц совокупности имеют значение признака, не превышающее рассматриваемый.

Если приходится иметь дело с вариационным рядом с неравными интервалами, то для сопоставимости результатов нужно частоты или частости привести к единичному интервалу. Полученное отношение называется плотностью распределения: , или , где и ? абсолютная и относительная плотности распределения, fi и wi ? частота и частость, hi ? ширина i-го интервала.

Медиана распределения

Медианой распределения называют значение признака, который делит совокупность на две равные части со значением признака меньше и больше медианы. В интервальном вариационном ряду медиана определяется по формуле

.

В этой формуле ? нижняя граница интервала, в котором находится медиана, к ? число групп, на которые разбита совокупность, ФMe ?1 ? накопленная частота в интервале, предшествующем медианному, fMe ? частота в медианном интервале. Вывод формулы для вычисления медианы приведен на рисунке ниже.

Для определение медианы нужно найти сначала медианный интервал (интервал, содержащий медианное значение признака).

Величина x0 ? нижняя граница интервала является известной. Осталось найти величину x, которая равна расстоянию от нижней границы медианного интервала до медианы. Внутри этого интервала содержится



единиц статистической совокупности. На каждую единицу статистической совокупности в медианном интервале приходится расстояние .



Таким образом,







и мы приходим к формуле, изображенной на рисунке выше.

Квартили распределения

Аналогично определяется значение признака, делящего совокупность на четыре) равные по числу единиц части (квартили). Иногда используется также понятия квинтилей и децилей, делящих совокупность на 5 и 10 равных частей, соответственно.

Приведем формулы для первого и третьего квартилей







Вывод этих формул производится точно также, как и вывод формулы для медианы и мы его не приводим.

Легко заметить, что медиана является, по сути, вторым квартилем.

В качестве примера, вычислим значение первого и третьего квартилей для распределения хозяйств области по урожайности (см. таблицу выше).

Первый квартиль находится в интервале, содержащем 36 значение признака, (интервал хозяйств с урожайностью 25 ? 30 ц /га). Поэтому x0 = 25

; ; h = 5.

Поэтому

Вычисление третьего квартиля предлагается выполнить самостоятельно. Ответ приведен ниже.



Мода распределения

Важным для понимания структуры вариационного ряда является понятие моды распределения.

Модой распределения (Mo) называется значение признака с наибольшей частотой. В интервальном вариационном ряду модальным является интервал с наибольшей частотой. Естественно предположить, что значение модального признака находится внутри модального интервала ближе к той из границ, за которой частота в соседнем интервале больше. Отсюда следует обычно применяемая расчетная формула для моды в интервальном ряду



,



где fMo , fMo-1 , fMo+1 ? частоты в модальном, предыдущем и следующем интервалах, hMo ? величина модального интервала. Из приведенной формулы видно, что если частоты fMo , fMo-1 , fMo+1 одинаковы, то модальный признак находится точно посередине модального интервала.

Принципы графического определения моды изображены на следующем рисунке (мода отмечена стрелкой).