Основные показатели вариации в анализе взаимосвязей

Тема 9 Показатели вариации

Содержание курса лекций «Статистика»

Показатели вариации в анализе взаимосвязей

Тема 9 Показатели вариации

Для измерения степени колеблемости отдельных значений признака относительно средней исчисляют основные показатели вариации.



Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Измерение вариации признаков имеет как теоретическое, так и практическое значение.

Так, например, для выявления наиболее стабильно работающего коллектива или предприятия наравне с другими показателями рассчитывают и основные показатели вариации. Эти показатели дают возможность количественно определить размеры устойчивости производительности труда, уровня квалификации, цен на основные виды выпускаемой продукции и т.п. Измерение размеров вариации такого показателя, как «выполнение работ в срок» имеет важное значение для принятия решений заказчиками и инвесторами, т.к. ситуация, в которой присутствует изменчивость признака, часто содержит риск. Осо­бое значение показатели вариации приобретают в анализе рынка ценных бумаг, где мера колеблемости отождествляется с мерой рискованности вложения денежных средств.



Основными показателями, характеризующими вариацию, являются:

  • размах вариации;
  • среднее линейное отклонение;
  • дисперсия;
  • среднее квадратическое отклонение;
  • коэффициент вариации.


1)  Размах вариации

9.1 Размах вариации
(9.1 ) –  размах вариации


2) Среднее линейное отклонение исчисляют для того, чтобы дать обобщающую характеристику распределению отклонений:

среднее линейное отклонение для несгруп данных
(9.2) – среднее линейное отклонение                  для несгруппированных данных

Среднее линейное отклонение для вариационного ряда
(9.3) – среднее линейное отклонение                          для вариационного ряда

где  –абсолютные значения отклоненийабсолютные значения отклонений отдельных вариантов xi от средней арифметической ;  fi  – частота.



3. Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической:

Дисперсия
(9.4) –  дисперсия


4. Среднее квадратическое отклонение – корень квадратный из дисперсии:

Среднее квадратическое отклонение для несгруппированных данных
(9.5) – среднее квадратическое отклонение                  для несгруппированных данных

 среднее квадратическое отклонение для вариационного ряда
(9.6)- среднее квадратическое отклонение                         для вариационного ряда


!!!В отличие от дисперсии среднее квадратическое отклонение является абсолютной мерой вариации признака в совокупности и выражается в единицах измерения варьирующего признака (руб., тыс., млн и т.д.).!!!



5. Коэффициент вариации – используется для сравнительной оценки вариации, а также для характеристики однородности совокупности:

коэффициент вариации
(9.7) – коэффициент вариации


Пример. Для иллюстрации расчетов воспользуемся данными нижеприведенной табл. 9.1:

Таблица 9.1 ‑ Данные о продаже основных марок холодильников:

Модель Цена

( $ )

Объем продаж (шт.) xifi
1 Siemens 1000 30 30000
2 Bosch 800 26 20800
3 AEG Santo 900 24 21600
4 Miele KF 1200 30 36000
5 Gorenje 870 20 17400
6 Haier 570 23 13110
7 Samsung 760 30 22800
8 Zanussi 700 20 14000
9 Daewoo 460 20 9200
10 Beko 650 25 16250
11 Candy 480 20 9600
10 Whirpool 470 21 9870
ИТОГО 8860 289 220630

Рассчитаем размах вариации.

R= 1200-460=740$

Пример вычисления размаха вариации


Размах вариации служит незаменимой мерой разброса экстремальных значений признака. Кроме характеристики границ разброса признака, размах вариации может быть использован для выявления ошибок. При наличии очень больших (или очень малых) ошибочно записанных значений признака размах вариации сразу резко возрастает, что требует проверки и корректировки исходных данных.

Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака.


Этого недостатка лишен другой показатель – дисперсия, рассчитываемый как средний квадрат отклонений значений признака от их средней величины.

Между индиви­дуальными отклонениями от средней и колеблемостью признака существует прямая зави­симость: чем сильнее колеблемость признака, тем больше отклонения его значений от средней величины и менее устойчив изучаемый показатель.

Как и средняя величина этот показатель может быть рассчитан в двух формах: взвешенной и невзвешенной

По приведенным выше данным определим средневзвешенную цену холодильника:

Пример расчета сред арифм взвешенная
Пример вычисления средней арифметической взвешенной

Далее рассчитаем дисперсию:

Пример расчета дисперсии
Пример вычисления дисперсии

!!!Следует отметить, что дисперсия еще не дает представления об однородности со­вокупности, и этому показателю трудно дать экономическую интерпретацию, т.к. он рас­считан в квадратных единицах. Поэтому следующим шагом в исследовании однородности совокупности является расчет среднего квадратического отклонения, показывающего, на­сколько в среднем отклоняются конкретные варианты признака от его среднего значения. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность что и изучаемый признак.!!!



Рассчитаем среднее квадратическое отклонение

Пример расчета сред квадрат отклон
Пример вычисления среднего квадратического отклонения

Вывод: Таким образом, цена каждой марки холодильника отклоняется от средней цены в среднем на 271,1 $



Рассмотренные показатели позволяют получить абсолютное значение вариации признака. Однако для сравнения разных совокупностей с точки зрения устойчивости ка­кого-либо одного признака или для определения однородности совокупности рассчиты­вают относительные показатели.

Эти показатели вычисляются как отношение размаха вариации, среднего линейно­го отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего эти показатели выражаются в процентах.



Определим значение  показателя вариации по вышеприведенным данным таблицы

Пример расчета показателя вариации
Пример вычисления показателя вариации

Совокупность считается однородной, если V не превышает 33%.

Если V<10%  вариация признака слабая;

10% < V<25% –  вариация средняя;

V>25% – вариация сильная.

Вывод: Рассчитанная величина свидетельствует о неоднородности цен на холодильники, т.к. однородной совокупность считается, если коэффициент вариации меньше 33% (для распределений близких к нормальному).



!! Следует отметить, что коэффициент вариации может быть более 100%, что, в част­ности, может быть при наличии значений сильно отличающихся от средней величины. Такой результат означает, что в исследуемой совокупности сильна вариация признаков по отношению к средней величине.


Изучая вариацию интересующего нас признака в пределах исследуемой совокупно­сти и опираясь на общую среднюю в расчетах, трудно оценить степень воздействия на него какого-либо отдельного признака.

При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным (оказывающим влияние на взаимосвязанный с ним признак) и результативным (подвер­женным влиянию).



Для выявления взаимосвязи исходная совокупность делится по факторному признаку на группы. Выводы о степени взаимосвязи базируются на анализе вариации резуль­тативного признака. Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих вариацию индиви­дуальных значений признака, используют правило сложения дисперсий.

Общая дисперсия представляет собой сумму средней из виутригрупповой и меж­групповой и дисперсий:

Общая дисперсия
(9.8) – общая дисперсия

 где:

пояснение к общей диспер


Общая дисперсия характеризует вариацию признака по всей совокупности как ре­зультат влияния всех факторов, определяющих индивидуальные различия единиц сово­купности.


формула 9.9
(9.9)

где:

к формуле 9.9



Межгрупповая дисперсия  характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки.

межгрупповая дисперсия
(9.10) – межгрупповая дисперсия

где:

Пояснение межгрупповая дисперсия



Средняя из внутригрупповых дисперсий отражает ту часть вариации результа­тивного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами внутригрупповая дисперсия отражает случайную вариацию. Внутригрупповая дисперсия рас­считывается отдельно по каждой j-ой группе.

Внутригрупповая дисперсия
(9.11) – внутригрупповая дисперсия

где:

Пояснение внутригрупповая дисперсия



Для всех групп в целом вычисляется средняя из внутригрупповых дисперсий, взвешенных на частоты соответствующих групп по формуле:

Средняя из внутригрупповых дисперсий
(9.12) – средняя из внутригрупповых дисперсий


Взаимосвязь между тремя видами дисперсий получила название правила сложения дисперсий. Таким образом, зная два вида дисперсий всегда можно определить третий:

Взаимосвязь между тремя видами дисперсий
(9.13) – правило сложения                                    дисперсий

Из этого равенства следует, что общая дисперсия, как правило, будет больше средней из групповых дисперсий. Это обусловлено тем, что при расчленении об­щей совокупности единиц на части по какому-либо признаку образуются более или менее однородные группы, в результате чего сокращается колеблемость признаков в пределах каждой группы. Это приводит к тому, что средняя из групповых дисперсий оказывается меньше дисперсии признака по всей совокупности единиц, причем разница между этими показателями будет тем больше, чем однороднее получаются группы в результате расчле­нения общей совокупности.



Теснота связи между факторным и результативным признаками оценивается на ос­нове эмпирического корреляционного отношения:

эмпирич корреляц отнош
(9.14)

Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.



Пример. На следующем условном примере исследуем зависимость объема выполненных ра­бот от формы собственности проектно-изыскательских организаций.

Таблица 9.2. Выполнение работ проектно-изыскательскими организациями разной формы собственности

Форма собственности Количество предприятий

Объем выполненных работ

(млн. руб.)

Итого
Государственная 4 10,30,20,40 100
Негосударственная 6 20, 40, 60, 20, 50, 50 240
Итого 10 340

Решение:

1) Определим средний объем работ для предприятий двух форм собственности.

пример 1


2) Определим средний объем работ для каждой формы собственности.

Пример 2


3) Рассчитаем общую и внутригрупповые (т.е. для каждой группы) дисперсии.

пример 3


4) Определим среднюю из внутригрупповых и межгрупповую дисперсию. Для этого полученные ранее данные заносятся в таблицу расчета.

Таблица 9.3. – Вспомогательная таблица

Форма

собственности

Число

предприятий

Средняя

по группе

Внутригрупповые

дисперсии

Государственная 4 25 125
Негосударственная 6 40 233
Итого 10

Пример. Средняя из внутригрупповых дисперсий

Пример расчета средней из внутригрупповых дисперсий


Пример. Межгрупповая дисперсия

ПРимер расчета межгрупповой дисперсии



На последнем этапе решения задачи необходимо проверить тождество, отражающее закон сложения дисперсий:

Проверка закона сложения дисперсий:  54,0+189,8=243,8


Вывод: Таким образом, можно сделать вывод о том, что объем работ, выполненных проектно-изыскательскими организациями на 22% [(54,0/243,8) х 100%] зависит от фак­тора, положенного в основание группировки, т.е. от формы собственности, а на 78% [(189,8/243,8)х100%)] ‑ от прочих факторов.


Вывод о том, что объем выполненных работ в гораздо большей степени зависит от каких-либо других факторов, чем от формы собственности предприятий подтверждается и величиной эмпирического корреляционного отношения:

Пример расчета эмперич корреляц отнош

Вывод: Величина этого показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика


Содержание курса лекций «Статистика»


Контрольные задания

  1. Распределение студентов одного из факультетов по возрасту характеризуется следующими данными:
Возраст студентов, лет 17 18 19 20 21 22 23 24 Всего
Число студентов 20 80 90 110 130 170 90 60 750

Вычислить: а) размах вариации; б)среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; относительные показатели вариации возраста студентов.

2. По данным статистических ежегодников постройте таблицу с рядом показателей и определите показатели вариации: а) размах; б) среднее линейное отклонение; в) среднее квадратическое отклонение; г) коэффициент вариации. Оцените количественную однородность совокупности.

Содержание курса лекций «Статистика»

Ссылка на основную публикацию