Рассчитать среднюю величину по способу моментов. Среднее значение по способу моментов

Метод моментов приравнивает моменты теоретического распределения к моментам эмпирического распределения (распределения, построенного по наблюдениям). Из полученных уравнений находятся оценки параметров распределения. Например, для распределения с двумя параметрами первые два момента (среднее и дисперсия распределения, соответственно, m и s) будут приравнены первым двум эмпирическим (выборочным) моментам (среднему и дисперсии выборки, соответственно), и затем будет произведено оценивание.

Где А – условный нуль, равный варианте с максимальной частотой (середина интервала с максимальной частотой), h – шаг интервала,

Назначение сервиса . С помощью онлайн-калькулятора вычисляется среднее значение по способу моментов. Результат решения оформляется в формате Word .

Инструкция . Для получения решения необходимо заполнить исходные данные и выбрать параметры отчета для оформления в Word.

Алгоритм нахождения средней по способу моментов

Пример . Затраты рабочего времени на однородную технологическую операцию распределялись между рабочими следующим образом:

Требуется определить среднюю величину затрат рабочего времени и среднеквадратическое отклонение по способу моментов; коэффициент вариации; моду и медиану.
Таблица для расчета показателей.
Группы Середина интервала, x i Кол-во, f i x i ·f i Накопленная частота, S (x-x ) 2 ·f
5 - 10 7.5 20 150 20 4600.56
15 - 20 17.5 25 437.5 45 667.36
20 - 25 22.5 50 1125 95 1.39
25 - 30 27.5 30 825 125 700.83
30 - 35 32.5 15 487.5 140 1450.42
35 - 40 37.5 10 375 150 2200.28
150 3400 9620.83

Мода

где x 0 – начало модального интервала; h – величина интервала; f 2 –частота, соответствующая модальному интервалу; f 1 – предмодальная частота; f 3 – послемодальная частота.
Выбираем в качестве начала интервала 20, так как именно на этот интервал приходится наибольшее количество.

Наиболее часто встречающееся значение ряда – 22.78 мин.
Медиана
Медианным является интервал 20 - 25, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Таким образом, 50% единиц совокупности будут меньше по величине 23 мин.
.



Находим А = 22.5, шаг интервала h = 5.
Средний квадрат отклонений по способу моментов .
x ц x * i x * i f i 2 f i
7.5 -3 -60 180
17.5 -1 -25 25
22.5 0 0 0
27.5 1 30 30
32.5 2 30 60
37.5 3 30 90
5 385

мин.

Среднее квадратическое отклонение .
мин.
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>30% ,но v<70%, то вариация умеренная.

Пример

Для оценки ряда распределения найдем следующие показатели:

Средняя взвешенная

Среднее значение изучаемого признака по способу моментов .

где А – условный нуль, равный варианте с максимальной частотой (середина интервала с максимальной частотой), h – шаг интервала.

Вариационный размах (или размах вариации) - это разница между максимальным и минимальным значениями признака:

В нашем примере размах вариации сменной выработки рабочих составляет: в первой бригаде R=105-95=10 дет., во второй бригаде R=125-75=50 дет. (в 5 раз больше). Это говорит о том, что выработка 1-й бригады более «устойчива», но резервов роста выработки больше у второй бригады, т.к. в случае достижения всеми рабочими максимальной для этой бригады выработки, ею может быть изготовлено 3*125=375 деталей, а в 1-й бригаде только 105*3=315 деталей.
Если крайние значения признака не типичны для совокупности, то используют квартильный или децильный размахи. Квартильный размах RQ= Q3-Q1 охватывает 50% объема совокупности, децильный размах первый RD1 = D9-D1охватывает 80% данных, второй децильный размах RD2= D8-D2 – 60 %.
Недостатком показателя вариационного размаха является, но что его величина не отражает все колебания признака.
Простейшим обобщающим показателем, отражающим все колебания признака, является среднее линейное отклонение , представляющее собой среднюю арифметическую абсолютных отклонений отдельных вариант от их средней величины:

,
для сгруппированных данных
,
где хi – значение признака в дискретном ряду или середина интервала в интервальном распределении.
В вышеприведенных формулах разности в числителе взяты по модулю, иначе, согласно свойству средней арифметической, числитель всегда будет равен нулю. Поэтому среднее линейное отклонение в статистической практике применяют редко, только в тех случаях, когда суммирование показателей без учета знака имеет экономический смысл. С его помощью, например, анализируется состав работающих, рентабельность производства, оборот внешней торговли.
Дисперсия признака – это средний квадрат отклонений вариант от их средней величины:
простая дисперсия
,
взвешенная дисперсия
.
Формулу для расчета дисперсии можно упростить:

Таким образом, дисперсия равна разности средней из квадратов вариант и квадрата средней из вариант совокупности:
.
Однако, вследствие суммирования квадратов отклонений дисперсия дает искаженное представление об отклонениях, поэтому ее на основе рассчитывают среднее квадратическое отклонение , которое показывает, на сколько в среднем отклоняются конкретные варианты признака от их среднего значения. Вычисляется путем извлечения квадратного корня из дисперсии:
для несгруппированных данных
,
для вариационного ряда

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность, тем более надежной (типичной) будет средняя величина.
Среднее линейное и среднее квадратичное отклонение - именованные числа, т. е. выражаются в единицах измерения признака, идентичны по содержанию и близки по значению.
Рассчитывать абсолютные показатели вариации рекомендуется с помощью таблиц.
Таблица 3 – Расчет характеристик вариации (на примере срока данных о сменной выработке рабочих бригады)


Число рабочих,

Середина интервала,

Расчетные значения

Итого:

Среднесменная выработка рабочих:

Среднее линейное отклонение:

Дисперсия выработки:

Среднее квадратическое отклонение выработки отдельных рабочих от средней выработки:
.

1 Расчет дисперсии способом моментов

Вычисление дисперсий связано с громоздкими расчетами (особенно если средняя величина выражена большим числом с несколькими десятичными знаками). Расчеты можно упростить, если использовать упрощенную формулу и свойства дисперсии.
Дисперсия обладает следующими свойствами:

  1. если все значения признака уменьшить или увеличить на одну и ту же величину А, то дисперсия от этого не уменьшится:

,

, то или
Используя свойства дисперсии и сначала уменьшив все варианты совокупности на величину А, а затем разделив на величину интервала h, получим формулу вычисления дисперсии в вариационных рядах с равными интервалами способом моментов:
,
где – дисперсия, исчисленная по способу моментов;
h – величина интервала вариационного ряда;
– новые (преобразованные) значения вариант;
А– постоянная величина, в качестве которой используют середину интервала, обладающего наибольшей частотой; либо вариант, имеющий наибольшую частоту;
– квадрат момента первого порядка;
– момент второго порядка.
Выполним расчет дисперсии способом моментов на основе данных о сменной выработке рабочих бригады.
Таблица 4 – Расчет дисперсии по способу моментов


Группы рабочих по выработке, шт.

Число рабочих,

Середина интервала,

Расчетные значения

Порядок расчета:


  1. рассчитываем дисперсию:

2 Расчет дисперсии альтернативного признака

Среди признаков, изучаемых статистикой, есть и такие, которым свойственны лишь два взаимно исключающих значения. Это альтернативные признаки. Им придается соответственно два количественных значения: варианты 1 и 0. Частостью варианты 1, которая обозначается p, является доля единиц, обладающих данным признаком. Разность 1-р=q является частостью варианты 0. Таким образом,


хi

Средняя арифметическая альтернативного признака
, т. к. p+q=1.

Дисперсия альтернативного признака
, т.к. 1-р=q
Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, и доли единиц, не обладающих этим признаком.
Если значения 1 и 0 встречаются одинаково часто, т. е. p=q, дисперсия достигает своего максимума pq=0,25.
Дисперсия альтернативного признака используется в выборочных обследованиях, например, качества продукции.

3 Межгрупповая дисперсия. Правило сложения дисперсий

Дисперсия, в отличие от других характеристик вариации, является аддитивной величиной. То есть в совокупности, которая разделена на группы по факторному признаку х, дисперсия результативного признака y может быть разложена на дисперсию в каждой группе (внутригрупповую) и дисперсию между группами (межгрупповую). Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучение вариации в каждой группе, а также между этими группами.

Общая дисперсия измеряет вариацию признака у по всей совокупности под влиянием всех факторов, вызвавших эту вариацию (отклонения). Она равна среднему квадрату отклонений отдельных значений признака у от общей средней и может быть вычислена как простая или взвешенная дисперсия.
Межгрупповая дисперсия характеризует вариацию результативного признака у , вызванную влиянием признака-фактора х , положенного в основу группировки. Она характеризует вариацию групповых средних и равна среднему квадрату отклонений групповых средних от общей средней :
,
где – средняя арифметическая i-той группы;
– численность единиц в i-той группе (частота i-той группы);
– общая средняя совокупности.
Внутригрупповая дисперсия отражает случайную вариацию, т. е. ту часть вариации, которая вызвана влиянием неучтенных факторов и не зависит от признака-фактора, положенного в основу группировки. Она характеризует вариацию индивидуальных значений относительно групповых средних, равна среднему квадрату отклонений отдельных значений признака у внутри группы от средней арифметической этой группы (групповой средней) и вычисляется как простая или взвешенная дисперсия для каждой группы:
или ,
где – число единиц в группе.
На основании внутригрупповых дисперсий по каждой группе можно определить общую среднюю из внутригрупповых дисперсий :
.
Взаимосвязь между тремя дисперсиями получила название правила сложения дисперсий , согласно которому общая дисперсия равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий:

Пример . При изучении влияния тарифного разряда (квалификации) рабочих на уровень производительности их труда получены следующие данные.
Таблица 5 – Распределение рабочих по среднечасовой выработке.



п/п

Рабочие 4-го разряда

Рабочие 5-го разряда

Выработка
рабочего, шт.,

Выработка
рабочего, шт.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

В данном примере рабочие разделены на две группы по факторному признаку х – квалификации, которая характеризуется их разрядом. Результативный признак – выработка – варьируется как под его влиянием (межгрупповая вариация), так и за счет других случайных факторов (внутригрупповая вариация). Задача заключается в измерении этих вариаций с помощью трех дисперсий: общей, межгрупповой и внутригрупповой. Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х . Остальная часть общей вариации у вызвана изменением прочих факторов.
В примере эмпирический коэффициент детерминации равен:
или 66,7 %,
Это означает, что на 66,7% вариация производительности труда рабочих обусловлена различиями в квалификации, а на 33,3% – влиянием прочих факторов.
Эмпирическое корреляционное отношение показывает тесноту связи между группировочным и результативными признаками. Рассчитывается как корень квадратный из эмпирического коэффициента детерминации:

Эмпирическое корреляционное отношение , как и , может принимать значения от 0 до 1.
Если связь отсутствует, то =0. В этом случае =0, то есть групповые средние равны между собой и межгрупповой вариации нет. Значит группировочный признак – фактор не влияет на образование общей вариации.
Если связь функциональная, то =1. В этом случае дисперсия групповых средних равна общей дисперсии (), то есть внутригрупповой вариации нет. Это означает, что группировочный признак полностью определяет вариацию изучаемого результативного признака.
Чем ближе значение корреляционного отношения к единице, тем теснее, ближе к функциональной зависимости связь между признаками.
Для качественной оценки тесноты связи между признаками пользуются соотношениями Чэддока.

В примере , что свидетельствует о тесной связи между производительностью труда рабочих и их квалификацией.

Методы вычисления средней арифметической (средней арифметической простой и взвешенной, по способу моментов)

Определяем средние величины:

Мода (Мо) =11, т.к. данная варианта встречается в вариационном ряду наиболее часто (р=6).

Медиана (Ме) - порядковый номер варианты занимающей срединное положение = 23, это место в вариационном ряду занимает варианта равная 11. Средняя арифметическая (М) позволяет наиболее полно охарактеризовать средний уровень изучаемого признака. Для вычисления средней арифметической используется два способа: среднеарифметический способ и способ моментов.

Если частота встречаемости каждой варианты в вариационном ряду равна 1, то рассчитывают среднюю арифметическую простую, используя среднеарифметический способ: М = .

Если частота встречаемости вариант в вариационном ряду отличается от 1, то рассчитывают среднюю арифметическую взвешенную, по среднеарифметическому способу:

По способу моментов: А - условная средняя,

М = A + =11 += 10.4 d=V-A, A=Mo=11

Если число вариант в вариационном ряду более 30, то строится сгруппированный ряд. Построение сгруппированного ряда:

1) определение Vmin и Vmax Vmin=3, Vmax=20;

2) определение количества групп (по таблице);

3) расчет интервала между группами i = 3;

4) определение начала и конца групп;

5) определение частоты вариант каждой группы (таблица 2).

Таблица 2

Методика построения сгруппированного ряда

Длительность

лечения в днях

n=45 p=480 p=30 2 p=766

Преимущество сгруппированного вариационного ряда заключается в том, что исследователь работает не с каждой вариантой, а только с вариантами, являющимися средними для каждой группы. Это позволяет в значительной степени облегчить расчеты средней.

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Данную особенность статистической совокупности характеризует одно из групповых свойств генеральной совокупности - разнообразие признака . Например, возьмем группу мальчиков 12 лет и измерим их рост. После проведенных расчетов средний уровень данного признака составит 153 см. Но средняя характеризует общую меру изучаемого признака. Среди мальчиков данного возраста есть мальчики, рост которых составляет 165 см или 141 см. Чем больше мальчиков будут иметь рост отличный от 153 см, тем больше будет разнообразие этого признака в статистической совокупности.

Статистика позволяет охарактеризовать данное свойство следующим критериями:

лимит (lim),

амплитуда (Amp),

среднеквадратическое отклонение (у),

коэффициент вариации (Сv).

Лимит (lim) определяется крайними значениями вариант в вариационном ряду:

lim=V min /V max

Амплитуда (Amp) - разность крайних вариант:

Amp=V max -V min

Данные величины учитывают только разнообразие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Поэтому данными критериями можно пользоваться для приближенной характеристики разнообразия, особенно при малом числе наблюдений (n<30).

вариационный ряд медицинская статистика

А – условная средняя (чаще других повторяющаяся в вариационном ряду)

а – условное отклонение от условной средней (ранг)

i – интервал

1-ый этап - определение середины групп;

2-ой этап – ранжирование групп: 0 присваивается группе, частота встречаемости врианты в которой – наибольшая. Т.е. в данном случае 7-11 (частота -32). Вверх от данной группы ранжирование производится прибавляя (-1). Вниз – прибавка (+1).

3-ий этап – определение условной моды (условная средняя). А –это середина модального интервала. В нашем случае модальным интервалом является 7 -11, таким образом А = 9.

4-ый этап –определение интервала. Интервал во всех группах ряда одинаков и равен 5. i = 5/

5-й этап –определение общего числа наблюдений. n = ∑p = 103.

Подставляем, полученные данные в формулу:

Задания для самостоятельной работы

Используя данные сгруппированного вариационного ряда рассчитайте среднюю арифметическую по способу моментов.

Вариант №1

Вариант №2

Вариант №3

Вариант №4

Вариант №5

Вариант №6



Вариант №7

Вариант №8

Вариант №9

Вариант №10

Вариант №11

Вариант №12

Задача №4 Определение моды и медианы в не сгруппированном вариационном ряду с нечетным количеством вариант

Сроки стационарного лечения больных детей в днях: 15, 14, 18, 17, 16, 20, 19, 16, 14, 16, 17, 12, 18, 19, 20.

Для определения моды в вариационном ряду ранжирование ряда необязательно. Однако, прежде чем определять медиану, необходимо выстроить вариационный ряд в порядке возрастания или убывания.

12, 14, 14, 15, 16, 16, 16, 17, 17, 18, 18, 19, 19, 20, 20.

Мода = 16. Т.к. вариант 16 встречается наибольшее число раз (3 раза).

В случае если вариант, имеющих наибольшую частоту встречаемости несколько, то в вариационном ряду может быть указано две и более Моды.

Медиана в ряду с нечетным количеством определяется по формуле:

8 –это порядковый номер медианы в ранжированном вариационном ряду,

т.о. Ме = 17.

Задача №5 Определение моды и медианы в не сгруппированном вариационном ряду с четным количеством вариант.



На основе данных, приведенных в задании, требуется найти моду и медиану

Сроки стационарного лечения больных детей в днях: 15, 14, 18, 17, 16, 20, 19, 16, 14, 16, 17, 12, 18, 19, 20, 11

Строим ранжированный вариационный ряд:

11, 12, 14, 14, 15, 16, 16, 16, 17, 17, 18, 18, 19, 19, 20, 20

У нас имеется два срединных числа 16 и 17. В таком случае медиана находится как среднее арифметическое между ними. Me = 16,5.

4. Четные и нечетные.

В чётных вариационных рядах сумма частот или общее число наблюдений выражено чётным числом, в нечётных ― нечётным.

5. Симметричные и асимметричные.

В симметричном вариационном ряду все виды средних величин совпадают или очень близки (мода, медиана, среднее арифметическое).

В зависимости от характера изучаемых явлений, от конкретных задач и целей статистического исследования, а также от содержания исходного материала, в санитарной статистике применяются следующие виды средних величин:

· структурные средние (мода, медиана);

· средняя арифметическая;

· средняя гармоническая;

· средняя геометрическая;

· средняя прогрессивная.

Мода (М о) - величина варьирующего признака, которая более часто встречается в изучаемой совокупности т.е. варианта, соответствующая наибольшей частоте. Находят ее непосредственно по структуре вариационного ряда, не прибегая к каким-либо вычислениям. Она обычно является величиной очень близкой к средней арифметической и весьма удобна в практической деятельности.

Медиана (М е) - делящая вариационный ряд (ранжированный, т.е. значения вариант располагаются в порядке возрастания или убывания) на две равные половины. Медиана вычисляется при помощи так называемого нечетного ряда, который получают путем последовательного суммирования частот. Если сумма частот соответствует четному числу, тогда за медиану условно принимают среднюю арифметическую из двух средних значений.

Мода и медиана применяются в случае незамкнутой совокупности, т.е. когда наибольшая или наименьшая варианты не имеют точной количественной характеристики (например, до 15 лет, 50 и старше и т.п.). В этом случае среднюю арифметическую (параметрические характеристики) рассчитать нельзя.

Средня я арифметическая - самая распространенная величина. Средняя арифметическая обозначается чаще через М .

Различают среднюю арифметическую простую и взвешенную.

Средняя арифметическая простая вычисляется:

― в тех случаях, когда совокупность представлена простым перечнем знаний признака у каждой единицы;

― если число повторений каждой варианты нет возможности определить;

― если числа повторений каждой варианты близки между собой.

Средняя арифметическая простая исчисляется по формуле:

где V - индивидуальные значения признака; n - число индивидуальных значений; - знак суммирования.

Таким образом, простая средняя представляет собой отношение суммы вариант к числу наблюдений.

Пример: определить среднюю длительность пребывания на койке 10 больных пневмонией:

16 дней - 1 больной; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

койко-дня.

Средняя арифметическая взвешенная исчисляется в тех случаях, когда индивидуальные значения признака повторяются. Ее можно вычислять двояким способом:

1. Непосредственным (среднеарифметическим или прямым способом) по формуле:

где P - частота (число случаев) наблюдений каждой варианты.

Таким образом, средняя арифметическая взвешенная представляет собой отношение суммы произведений вариант на частоты к числу наблюдений.

2. С помощью вычисления отклонений от условной средней (по способу моментов).

Основой для вычисления взвешенной средней арифметической является:

― сгруппированный материал по вариантам количественного признака;

― все варианты должны располагаться в порядке возрастания или убывания величины признака (ранжированный ряд).

Для вычисления по способу моментов обязательным условием является одинаковый размер всех интервалов.

По способу моментов средняя арифметическая вычисляется по формуле:

,

где М о - условная средняя, за которую чаще принимают величину признака, соответствующую наибольшей частоте, т.е. которая чаще повторяется (Мода).

i - величина интервала.

a - условное отклонение от условий средней, представляющее собой последовательный ряд чисел (1, 2 и т.д.) со знаком + для вариант больших условной средней и со знаком–(–1, –2 и т.д.) для вариант, которые ниже условной средней. Условное же отклонение от варианты, принятой за условную среднюю равно 0.

P - частоты.

Общее число наблюдений или n.

Пример: определить средний рост мальчиков 8 лет непосредственным способом (таблица1).

Т а б л и ц а 1

Рост в см

мальчиков P

Центральная

варианта V

Центральная варианта ― середина интервала ― определяется как полу сумма начальных значений двух соседних групп:

; и т.д.

Произведение VP получают путем умножения центральных вариант на частоты ; и т.д. Затем полученные произведения складывают и получают , которую делят на число наблюдений (100) и получают среднюю арифметическую взвешенную.

см.

Эту же задачу решим по способу моментов, для чего составляется следующая таблица 2:

Т а б л и ц а 2

Рост в см (V)

мальчиков P

В качестве М о принимаем 122, т.к. из 100 наблюдений у 33 человек рост был 122см. Находим условные отклонения (a) от условной средней в соответствии с вышесказанным. Затем получаем произведение условных отклонений на частоты (aP) и суммируем полученные величины (). В итоге получится 17. Наконец, данные подставляем в формулу.