Как сделать огиву

Добавил пользователь Алексей Ф.
Обновлено: 06.09.2024

Информация воспринимается легче, если представлена наглядно. Один из способов презентации отчетов, планов, показателей и другого вида делового материала – графики и диаграммы. В аналитике это незаменимые инструменты.

Построить график в Excel по данным таблицы можно несколькими способами. Каждый из них обладает своими преимуществами и недостатками для конкретной ситуации. Рассмотрим все по порядку.

Простейший график изменений

График нужен тогда, когда необходимо показать изменения данных. Начнем с простейшей диаграммы для демонстрации событий в разные промежутки времени.

Допустим, у нас есть данные по чистой прибыли предприятия за 5 лет:

Год Чистая прибыль*
2010 13742
2011 11786
2012 6045
2013 7234
2014 15605
* Цифры условные, для учебных целей.

Вставка-графики и диаграммы.

Выбор типа графиков.

Выбрали – скопировали таблицу с данными – вставили в область диаграммы. Получается вот такой вариант:

Конструктор.

Подписи данных.

Название осей.

Название диаграмм.

Данные.

График с двумя и более кривыми

Допустим, нам нужно показать не только чистую прибыль, но и стоимость активов. Данных стало больше:

Таблица с данными.

Но принцип построения остался прежним. Только теперь есть смысл оставить легенду. Так как у нас 2 кривые.

Легенда.

Добавление второй оси

Как добавить вторую (дополнительную) ось? Когда единицы измерения одинаковы, пользуемся предложенной выше инструкцией. Если же нужно показать данные разных типов, понадобится вспомогательная ось.

Сначала строим график так, будто у нас одинаковые единицы измерения.

Вторая ось.

Формат ряда данных.

Дополнительная ось.

Это один из способов. Есть и другой – изменение типа диаграммы.

Изменение типа.

Определяемся с видом для второго ряда данных. В примере – линейчатая диаграмма.

Линейчатая диаграмма.

Всего несколько нажатий – дополнительная ось для другого типа измерений готова.

Строим график функций в Excel

Вся работа состоит из двух этапов:

  1. Создание таблицы с данными.
  2. Построение графика.

Пример: y=x(?x – 2). Шаг – 0,3.

Составляем таблицу. Первый столбец – значения Х. Используем формулы. Значение первой ячейки – 1. Второй: = (имя первой ячейки) + 0,3. Выделяем правый нижний угол ячейки с формулой – тянем вниз столько, сколько нужно.

Таблица XY.

Отрицательные значения по Y.

Изменение ряда.

Жмем ОК и любуемся результатом.

Результат.

Оси подписаны.

Наложение и комбинирование графиков

Построить два графика в Excel не представляет никакой сложности. Совместим на одном поле два графика функций в Excel. Добавим к предыдущей Z=X(?x – 3). Таблица с данными:

2 графика функций.

А вот наши 2 графика функций в одном поле.

Пример с двумя графиками функций.

Графики зависимости

Данные одного столбца (строки) зависят от данных другого столбца (строки).

Построить график зависимости одного столбца от другого в Excel можно так:

Данные для графиков зависимости.

Условия: А = f (E); В = f (E); С = f (E); D = f (E).

Выбираем тип диаграммы. Точечная. С гладкими кривыми и маркерами.

Графики зависимости.

Готовые примеры графиков и диаграмм в Excel скачать:

ejenedelnyy-grafik-2-taymfreyma

Как сделать еженедельный график в Excel вместе с ежедневным.
Пример создания динамического синхронного еженедельного графика вместе с ежедневным. Синхронное отображение двух таймфреймов на одном графике.

Точно так же можно строить кольцевые и линейчатые диаграммы, гистограммы, пузырьковые, биржевые и т.д. Возможности Excel разнообразны. Вполне достаточно, чтобы наглядно изобразить разные типы данных.

Результаты группировки собранных статистических данных, как правило, представляются в виде рядов распределения. Ряд распределения - это упорядоченное распределение единиц совокупности на группы по изучаемому признаку.

Ряды распределения делятся на атрибутивные и вариационные, в зависимости от признака, положенного в основу группировки. Если признак качественный, то ряд распределения называется атрибутивным. Примером атрибутивного ряда является распределение предприятий и организаций по формам собственности (см. табл. 3.1).

Если признак, по которому строится ряд распределения, количественный, то ряд называется вариационным.

Вариационный ряд распределения всегда состоит из двух частей: вариант и соответствующих им частот (или частостей). Вариантой называется значение , которое может принимать признак у единиц совокупности, частотой - количество единиц наблюдения, обладающих данным значением признака. Сумма частот всегда равна объему совокупности. Иногда вместо частот рассчитывают частости - это частоты, выраженные либо в долях единицы (тогда сумма всех частостей равна 1), либо в процентах к объему совокупности (сумма частостей будет равна 100%).

Вариационные ряды бывают дискретными и интервальными. У дискретных рядов (табл. 3.7) варианты выражены конкретными числами, чаще всего целыми.

В интервальных рядах (см. табл. 3.2) значения показателя задаются в виде интервалов. Интервалы имеют две границы: нижнюю и верхнюю. Интервалы могут быть открытыми и закрытыми. У открытых нет одной из границ, так, в табл. 3.2 у первого интервала нет нижней границы, а у последнего - верхней. При построении интервального ряда в зависимости от характера разброса значений признака используют как равные интервальные промежутки, так и неравные (в табл. 3.2 представлен вариационный ряд с равными интервалами).

Если признак принимает ограниченное число значений, обычно не больше 10, строят дискретные ряды распределения. Если вариант больше, то дискретный ряд теряет свою наглядность; в этом случае целесообразно использовать интервальную форму вариационного ряда. При непрерывной вариации признака, когда его значения в определенных пределах отличаются друг от друга на сколь угодно малую величину, также строят интервальный ряд распределения.

3.3.1. Построение дискретных вариационных рядов

Рассмотрим методику построения дискретных вариационных рядов на примере.

Пример 3.2. Имеются следующие данные о количественном составе 60 семей:

Для того чтобы получить представление о распределении семей по числу их членов, следует построить вариационный ряд. Поскольку признак принимает ограниченное число целых значений строим дискретный вариационный ряд. Для этого сначала рекомендуется выписать все значения признака (число членов в семье) в порядке возрастания (т.е. провести ранжирование статистических данных):

Затем необходимо подсчитать число семей, имеющих одинаковый состав. Число членов семей (значение варьирующего признака) - это варианты (будем их обозначать через х), число семей, имеющих одинаковый состав, - это частоты (будем их обозначать через f ). Результаты группировки представим в виде следующего дискретного вариационного ряда распределения:

3.3.2. Построение интервальных вариационных рядов

Покажем методику построения интервальных вариационных рядов распределения на следующем примере.

Пример 3.3. В результате статистического наблюдения получены следующие данные о средней величине процентной ставки 50 коммерческих банков (%):

Как видим, просматривать такой массив данных крайне неудобно, кроме того, не видно закономерностей изменения показателя. Построим интервальный ряд распределения.

Число интервалов на практике часто задается самим исследователем исходя из задач каждого конкретного наблюдения. Вместе с тем его можно вычислить и математически по формуле Стерджесса

где n - число интервалов;

N - объем совокупности (число единиц наблюдения).

Для нашего примера получим: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6 " 7.

где хmax - максимальное значение признака;

хmin - минимальное значение признака.

Для нашего примера

Интервалы вариационного ряда наглядны, если их границы имеют "круглые" значения, поэтому округлим величину интервала 1,9 до 2, а минимальное значение признака 12,3 до 12,0.

Интервалы, как правило, записывают таким образом, чтобы верхняя граница одного интервала являлась одновременно нижней границей следующего интервала. Так, для нашего примера получим: 12,0-14,0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24,0-26,0.

Кроме того, в нашем примере мы могли бы сделать первый и последний интервалы открытыми, т.д. записать: до 14,0; 24,0 и выше.

При подсчете частот может возникнуть ситуация, когда значение признака попадет на границу какого-либо интервала. В таком случае можно руководствоваться правилом: данная единица приписывается к тому интервалу, для которого ее значение является верхней границей. Так, значение 16,0 в нашем примере будет относиться ко второму интервалу.

Результаты группировки, полученные в нашем примере, оформим в таблице.

В последней графе таблицы представлены накопленные частоты, которые получают путем последовательного суммирования частот, начиная с первой (например, для первого интервала - 5, для второго интервала 5 + 9 = 14, для третьего интервала 5 + 9 + 4 = 18 и т.д. ). Накопленная частота, например, 33, показывает, что у 33 банков кредитная ставка не превышает 20% (верхняя граница соответствующего интервала).

В процессе группировки данных при построении вариационных рядов иногда используются неравные интервалы. Это относится к тем случаям, когда значения признака подчиняются правилу арифметической или геометрической прогрессии или когда применение формулы Стерджесса приводит к появлению "пустых" интервальных групп, не содержащих ни одной единицы наблюдения. Тогда границы интервалов задаются произвольно самим исследователем исходя из здравого смысла и целей обследования либо по формулам. Так, для данных, изменяющихся в арифметической прогрессии, величина интервалов вычисляется следующим образом:

где ik - величина вычисляемого интервала;

ik - 1 - величина предыдущего интервала;

с - константа, на которую происходит увеличение длин интервалов.

Порядок расчетов границ неравных интервалов для данных, изменяющихся приблизительно в арифметической прогрессии, показан в табл. 3.15.

Для показателей, приблизительно изменяющихся в геометрической прогрессии, величину интервалов можно вычислить по формуле

где ik - величина вычисляемого интервала;

ik - 1 - величина предыдущего интервала;

с - константа-множитель геометрической прогрессии.

Для графического изображения дискретного вариационного ряда используется полигон распределения: на оси абсцисс откладывают значения вариант, а на оси ординат - соответствующие им частоты или частости, полученные точки соединяют отрезками (образуется ломаная линия). По данным табл. 3.7 построим полигон распределения (рис. 3.1).

Для графического изображения интервального ряда используют гистограмму, имеющую вид многоступенчатой фигуры, состоящей из прямоугольников. По оси абсцисс откладывают значения границ интервалов. Сами интервалы будут являться основаниями прямоугольников. Высота прямоугольников соответствует частоте или частости интервалов, которые откладываются по оси ординат.

По данным таблицы, приведенной в примере 3.3, построим гистограмму (рис. 3.2).

При неравных интервалах у гистограммы распределения высотами прямоугольников будут являться показатели плотности распределения, рассчитываемые как частное от деления частоты интервала на его величину.

Зависимость между значениями признака и накопленными частотами показывают особые графики, называемые кумулятой и огивой распределения.

Если ряд дискретный, то по оси абсцисс откладывают значения вариант ряда, а по оси ординат - рассчитанные накопленные частоты, получаемые для каждой конкретной варианты как сумма всех предыдущих частот. Полученные точки соединяют ломаной линией. Вместо значений накопленных частот можно взять значения накопленных частостей, тогда верхняя точка на кумулятивной кривой по оси ординат будет соответствовать значению 100%.

В случае интервального ряда при построении кумуляты по оси абсцисс отмечают границы интервальных групп, накопленные частоты по оси ординат относят к верхним границам интервалов.

По данным таблицы, приведенной в примере 3.3, построим кумуляту распределения для интервального ряда (рис. 3.2).

Если у кумулятивной кривой поменять местами ось абсцисс с осью ординат, получим график, называемый огивой распределения (рис. 3.4).

На основании данных статистического наблюдения, приведенных в таблице построить ранжированный, интервальный и кумулятивный ряды распределения сельскохозяйственных предприятий по факторному признаку, изобразить их графически.

Провести сводку данных. Посредством метода группировок определите зависимость результативного признака в сельскохозяйственных предприятиях от факторного. Построить таблицы и графики зависимости. Вывод.

группировка ряд распределение факторный

Качество почвы,баллы (х)

Урожайность овощей открытого грунта (у)

Построение ранжированного ряда распределения предполагает расположение всех вариантов ряда в порядке возрастания изучаемого признака (качества почвы). Проведение сортировки производилось в программе ТП Excel с использованием функции "Сортировка".

Урожайность овощей открытого грунта

Графическое изображение ранжированного ряда распределения


Линия на рис.1 носит название огива Гальтона. Данная огива имеет тенденцию плавного роста с небольшими скачками в некоторых точках. Для преобразования ранжированного ряда в интервальный лучше выполнить разбивку на группы вручную.

Построение интервального ряда распределения предприятий по изучаемому признаку предполагает определение числа групп (интервалов).

Для расчета числа групп воспользуемся формулой:


n=2•, где N-общее число единиц изучаемой совокупности.

Величина равного интервала вычисляется по формуле:



Кумулятивный ряд - это ряд в котором подсчитываются накопленные частоты. Он показывает, сколько единиц совокупности имеют значение признака не больше, чем данное значение, и вычисляется путем последовательного прибавления к частоте первого интервала частот последующих интервалов.

Интервальный вариационный ряд – это ряд распределения, в котором однородные группы составлены по признаку, меняющемуся непрерывно или принимающему слишком много значений.

Интервалы, \(\left.\left[a_,a_i\right.\right)\) \(\left.\left[a_,a_1\right.\right)\) \(\left.\left[a_,a_2\right.\right)\) . \(\left.\left[a_,a_k\right.\right)\)
Частоты, \(f_i\) \(f_1\) \(f_2\) . \(f_k\)

Здесь k - число интервалов, на которые разбивается ряд.

Размах вариации – это длина интервала, в пределах которой изменяется исследуемый признак: $$ F=x_-x_ $$

Правило Стерджеса
Эмпирическое правило определения оптимального количества интервалов k, на которые следует разбить ряд из N чисел: $$ k=1+\lfloor\log_2 N\rfloor $$ или, через десятичный логарифм: $$ k=1+\lfloor 3,322\cdot\lg N\rfloor $$

Скобка \(\lfloor\ \rfloor\) означает целую часть (округление вниз до целого числа).

Шаг интервального ряда – это отношение размаха вариации к количеству интервалов, округленное вверх до определенной точности: $$ h=\left\lceil\frac Rk\right\rceil $$

Скобка \(\lceil\ \rceil\) означает округление вверх, в данном случае не обязательно до целого числа.

Алгоритм построения интервального ряда
На входе: все значения признака \(\left\,\ j=\overline\)
Шаг 1. Найти размах вариации \(R=x_-x_\)
Шаг 2. Найти оптимальное количество интервалов \(k=1+\lfloor\log_2 N\rfloor\)
Шаг 3. Найти шаг интервального ряда \(h=\left\lceil\frac\right\rceil\)
Шаг 4. Найти узлы ряда: $$ a_0=x_,\ \ a_i=1_0+ih,\ \ i=\overline $$ Шаг 5. Найти частоты \(f_i\) – число попаданий значений признака в каждый из интервалов \(\left.\left[a_,a_i\right.\right)\).
На выходе: интервальный ряд с интервалами \(\left.\left[a_,a_i\right.\right)\) и частотами \(f_i,\ i=\overline\)

Заметим, что поскольку шаг h находится с округлением вверх, последний узел \(a_k\geq x_\).

Например:
Проведено 100 измерений роста учеников старших классов.
Минимальный рост составляет 142 см, максимальный – 197 см.
Найдем узлы для построения соответствующего интервального ряда.
По условию: \(N=100,\ x_=142\ см,\ x_=197\ см\).
Размах вариации: \(R=197-142=55\) (см)
Оптимальное число интервалов: \(k=1+\lfloor 3,322\cdot\lg 100\rfloor=1+\lfloor 6,644\rfloor=1+6=7\)
Шаг интервального ряда: \(h=\lceil\frac\rceil=\lceil 7,85\rceil=8\) (см)
Получаем узлы ряда: $$ a_0=x_=142,\ a_i=142+i\cdot 8,\ i=\overline $$

\(\left.\left[a_,a_i\right.\right)\) cм \(\left.\left[142;150\right.\right)\) \(\left.\left[150;158\right.\right)\) \(\left.\left[158;166\right.\right)\) \(\left.\left[166;174\right.\right)\) \(\left.\left[174;182\right.\right)\) \(\left.\left[182;190\right.\right)\) \(\left[190;198\right]\)

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

Относительная частота интервала \(\left.\left[a_,a_i\right.\right)\) - это отношение частоты \(f_i\) к общему количеству исходов: $$ w_i=\frac,\ i=\overline $$

Гистограмма относительных частот интервального ряда – это фигура, состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – относительным частотам каждого из интервалов.
Площадь гистограммы равна 1 (с точностью до округлений), и она является эмпирическим законом распределения исследуемого признака.

Накопленные относительные частоты – это суммы: $$ S_1=w_1,\ S_i=S_+w_i,\ i=\overline $$ Ступенчатая кривая \(F(x)\), состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – накопленным относительным частотам, является эмпирической функцией распределения исследуемого признака.
Кумулята – это ломаная, которая соединяет точки \((x_i,S_i)\), где \(x_i\) - середины интервалов.

Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:

i 1 2 3 4 5 6 7
\(\left.\left[a_,a_i\right.\right)\) cм \(\left.\left[142;150\right.\right)\) \(\left.\left[150;158\right.\right)\) \(\left.\left[158;166\right.\right)\) \(\left.\left[166;174\right.\right)\) \(\left.\left[174;182\right.\right)\) \(\left.\left[182;190\right.\right)\) \(\left[190;198\right]\)
\(f_i\) 4 7 11 34 33 8 3

Найдем середины интервалов, относительные частоты и накопленные относительные частоты:

\(x_i\) 146 154 162 170 178 186 194
\(w_i\) 0,04 0,07 0,11 0,34 0,33 0,08 0,03
\(S_i\) 0,04 0,11 0,22 0,56 0,89 0,97 1

Построим гистограмму и полигон:


Построим кумуляту и эмпирическую функцию распределения:


Эмпирическая функция распределения (относительно середин интервалов): $$ F(x)= \begin 0,\ x\leq 146\\ 0,04,\ 146\lt x\leq 154\\ 0,11,\ 154\lt x\leq 162\\ 0,22,\ 162\lt x\leq 170\\ 0,56,\ 170\lt x\leq 178\\ 0,89,\ 178\lt x\leq 186\\ 0,97,\ 186\lt x\leq 194\\ 1,\ x\gt 194 \end $$

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

Выборочная средняя интервального вариационного ряда определяется как средняя взвешенная по частотам: $$ X_=\frac=\frac1N\sum_^k x_if_i $$ где \(x_i\) - середины интервалов: \(x_i=\frac+a_i>,\ i=\overline\).
Или, через относительные частоты: $$ X_=\sum_^k x_iw_i $$

Модальным интервалом называют интервал с максимальной частотой: $$ f_m=max f_i $$ Мода интервального вариационного ряда определяется по формуле: $$ M_o=x_o+\frac<(f_m-f_)+(f_m+f_)>h $$ где
\(h\) – шаг интервального ряда;
\(x_o\) - нижняя граница модального интервала;
\(f_m,f_,f_\) - соответственно, частоты модального интервала, интервала слева от модального и интервала справа.

Медианным интервалом называют первый интервал слева, на котором кумулята превысила значение 0,5. Медиана интервального вариационного ряда определяется по формуле: $$ M_e=x_o+\frac<0,5-S_>>h $$ где
\(h\) – шаг интервального ряда;
\(x_o\) - нижняя граница медианного интервала;
\(S_\) накопленная относительная частота для интервала слева от медианного;
\(w_\) относительная частота медианного интервала.

Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).

Например:
Для распределения учеников по росту получаем:

\(x_i\) 146 154 162 170 178 186 194 ?
\(w_i\) 0,04 0,07 0,11 0,34 0,33 0,08 0,03 1
\(x_iw_i\) 5,84 10,78 17,82 57,80 58,74 14,88 5,82 171,68

$$ X_=\sum_^k x_iw_i=171,68\approx 171,7\ \text $$ На гистограмме (или полигоне) относительных частот максимальная частота приходится на 4й интервал [166;174). Это модальный интервал.
Данные для расчета моды: \begin x_o=166,\ f_m=34,\ f_=11,\ f_=33,\ h=8\\ M_o=x_o+\frac<(f_m-f_)+(f_m+f_)>h=\\ =166+\frac\cdot 8\approx 173,7\ \text \end На кумуляте значение 0,5 пересекается на 4м интервале. Это – медианный интервал.
Данные для расчета медианы: \begin x_o=166,\ w_m=0,34,\ S_=0,22,\ h=8\\ \\ M_e=x_o+\frac<0,5-S_>h=166+\frac\cdot 8\approx 172,6\ \text \end \begin \\ X_=171,7;\ M_o=173,7;\ M_e=172,6\\ X_\lt M_e\lt M_o \end Ряд асимметричный с левосторонней асимметрией.
При этом \(\frac<|M_o-X_|><|M_e-X_|>=\frac\approx 2,2\lt 3\), т.е. распределение умеренно асимметрично.

п.4. Выборочная дисперсия и СКО

Выборочная дисперсия интервального вариационного ряда определяется как средняя взвешенная для квадрата отклонения от средней: \begin D=\frac1N\sum_^k(x_i-X_)^2 f_i=\frac1N\sum_^k x_i^2 f_i-X_^2 \end где \(x_i\) - середины интервалов: \(x_i=\frac+a_i>,\ i=\overline\).
Или, через относительные частоты: $$ D=\sum_^k(x_i-X_)^2 w_i=\sum_^k x_i^2 w_i-X_^2 $$

Выборочное среднее квадратичное отклонение (СКО) определяется как корень квадратный из выборочной дисперсии: $$ \sigma=\sqrt $$

Например:
Для распределения учеников по росту получаем:

$x_i$ 146 154 162 170 178 186 194 ?
\(w_i\) 0,04 0,07 0,11 0,34 0,33 0,08 0,03 1
\(x_iw_i\) 5,84 10,78 17,82 57,80 58,74 14,88 5,82 171,68
\(x_i^2w_i\) - результат 852,64 1660,12 2886,84 9826 10455,72 2767,68 1129,08 29578,08

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

Исправленная выборочная дисперсия интервального вариационного ряда определяется как: \begin S^2=\fracD \end

Стандартное отклонение выборки определяется как корень квадратный из исправленной выборочной дисперсии: $$ s=\sqrt $$

Коэффициент вариации это отношение стандартного отклонения выборки к выборочной средней, выраженное в процентах: $$ V=\frac>\cdot 100\text $$

Например:
Для распределения учеников по росту получаем: \begin S^2=\frac\cdot 104,1\approx 105,1\\ s\approx 10,3 \end Коэффициент вариации: $$ V=\frac\cdot 100\text\approx 6,0\text\lt 33\text $$ Выборка однородна. Найденное значение среднего роста \(X_\)=171,7 см можно распространить на всю генеральную совокупность (старшеклассников из других школ).

п.6. Алгоритм исследования интервального вариационного ряда

На входе: все значения признака \(\left\,\ j=\overline\)
Шаг 1. Построить интервальный ряд с интервалами \(\left.\right[a_,\ a_i\left.\right)\) и частотами \(f_i,\ i=\overline\) (см. алгоритм выше).
Шаг 2. Составить расчетную таблицу. Найти \(x_i,w_i,S_i,x_iw_i,x_i^2w_i\)
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.

п.7. Примеры

Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.

\(\left.\left[a_,a_i\right.\right)\) лет \(\left.\left[18;22\right.\right)\) \(\left.\left[22;26\right.\right)\) \(\left.\left[26;30\right.\right)\) \(\left.\left[30;34\right.\right)\) \(\left.\left[34;38\right.\right)\)

Считаем частоты для каждого интервала. Получаем интервальный ряд:

\(\left.\left[a_,a_i\right.\right)\) лет \(\left.\left[18;22\right.\right)\) \(\left.\left[22;26\right.\right)\) \(\left.\left[26;30\right.\right)\) \(\left.\left[30;34\right.\right)\) \(\left.\left[34;38\right.\right)\)
\(f_i\) 1 7 12 6 4

2) Составляем расчетную таблицу:

\(x_i\) 20 24 28 32 36 ?
\(f_i\) 1 7 12 6 4 30
\(w_i\) 0,033 0,233 0,4 0,2 0,133 1
\(S_i\) 0,033 0,267 0,667 0,867 1 -
\(x_iw_i\) 0,667 5,6 11,2 6,4 4,8 28,67
\(x_i^2w_i\) 13,333 134,4 313,6 204,8 172,8 838,93

3) Строим полигон и кумуляту


Эмпирическая функция распределения: $$ F(x)= \begin 0,\ x\leq 20\\ 0,033,\ 20\lt x\leq 24\\ 0,267,\ 24\lt x\leq 28\\ 0,667,\ 28\lt x\leq 32\\ 0,867,\ 32\lt x\leq 36\\ 1,\ x\gt 36 \end $$ 4) Находим выборочную среднюю, моду и медиану $$ X_=\sum_^k x_iw_i\approx 28,7\ \text $$ На полигоне модальным является 3й интервал (самая высокая точка).
Данные для расчета моды: \begin x_0=26,\ f_m=12,\ f_=7,\ f_=6,\ h=4\\ M_o=x_o+\frac<(f_m-f_)+(f_m+f_)>h=\\ =26+\frac\cdot 4\approx 27,8\ \text \end
На кумуляте медианным является 3й интервал (преодолевает уровень 0,5).
Данные для расчета медианы: \begin x_0=26,\ w_m=0,4,\ S_=0,267,\ h=4\\ M_e=x_o+\frac<0,5-S_>>h=26+\frac\cdot 4\approx 28,3\ \text \end Получаем: \begin X_=28,7;\ M_o=27,8;\ M_e=28,6\\ X_\gt M_e\gt M_0 \end Ряд асимметричный с правосторонней асимметрией.
При этом \(\frac<|M_o-X_|><|M_e-X_|> =\frac=9\gt 3\), т.е. распределение сильно асимметрично.

5) Находим выборочную дисперсию и СКО: \begin D=\sum_^k x_i^2w_i-X_^2=838,93-28,7^2\approx 17,2\\ \sigma=\sqrt\approx 4,1 \end
6) Исправленная выборочная дисперсия: $$ S^2=\fracD=\frac\cdot 17,2\approx 17,7 $$ Стандартное отклонение \(s=\sqrt\approx 4,2\)
Коэффициент вариации: \(V=\frac\cdot 100\text\approx 14,7\text\lt 33\text\)
Выборка однородна. Найденное значение среднего возраста \(X_=28,7\) лет можно распространить на всю генеральную совокупность (пользователей коворкинга).

Читайте также: