Анализ дисперсии выработки в зависимости от стажа работы

Photo

Задача 1

1. Виды дисперсий выработки:

Для решения этой задачи необходимо рассчитать следующие виды дисперсий:

  • Групповые (частные) дисперсии для каждой группы стажа.
  • Межгрупповую дисперсию.
  • Среднюю из групповых (частных) дисперсий.

1.1. Групповые (частные) дисперсии:

Для каждой группы стажа рассчитаем дисперсию по формуле:

$\sigma_i^2 = \frac{\sum_{j=1}^{n_i} (x_{ij} - \bar{x}_i)^2}{n_i}$

где:

  • $\sigma_i^2$ - дисперсия для i-й группы
  • $x_{ij}$ - j-е значение выработки в i-й группе
  • $\bar{x}_i$ - среднее значение выработки в i-й группе
  • $n_i$ - количество значений в i-й группе

Группа 0-3 года:

Выборка: 6, 5, 9, 6, 10, 5, 4, 10, 8, 7, 6, 5, 9, 8, 6

$\bar{x}_1 = \frac{6+5+9+6+10+5+4+10+8+7+6+5+9+8+6}{15} = \frac{94}{15} \approx 6.27$

$\sigma_1^2 = \frac{(6-6.27)^2 + (5-6.27)^2 + (9-6.27)^2 + (6-6.27)^2 + (10-6.27)^2 + (5-6.27)^2 + (4-6.27)^2 + (10-6.27)^2 + (8-6.27)^2 + (7-6.27)^2 + (6-6.27)^2 + (5-6.27)^2 + (9-6.27)^2 + (8-6.27)^2 + (6-6.27)^2}{15} = \frac{50.93}{15} \approx 3.40$

Группа 4-7 лет:

Выборка: 7, 8, 6, 9, 8, 6, 10, 9, 8, 6, 7, 8, 7, 10, 10, 6, 7, 9, 8, 8

$\bar{x}_2 = \frac{7+8+6+9+8+6+10+9+8+6+7+8+7+10+10+6+7+9+8+8}{20} = \frac{151}{20} = 7.55$

$\sigma_2^2 = \frac{(7-7.55)^2 + (8-7.55)^2 + (6-7.55)^2 + (9-7.55)^2 + (8-7.55)^2 + (6-7.55)^2 + (10-7.55)^2 + (9-7.55)^2 + (8-7.55)^2 + (6-7.55)^2 + (7-7.55)^2 + (8-7.55)^2 + (7-7.55)^2 + (10-7.55)^2 + (10-7.55)^2 + (6-7.55)^2 + (7-7.55)^2 + (9-7.55)^2 + (8-7.55)^2 + (8-7.55)^2}{20} = \frac{44.95}{20} \approx 2.25$

Группа 7 и выше лет:

Выборка: 7, 6, 10, 9, 7, 8, 9, 8, 8, 7, 10, 11, 9, 6, 8, 8, 9, 10, 10, 8

$\bar{x}_3 = \frac{7+6+10+9+7+8+9+8+8+7+10+11+9+6+8+8+9+10+10+8}{20} = \frac{161}{20} = 8.05$

$\sigma_3^2 = \frac{(7-8.05)^2 + (6-8.05)^2 + (10-8.05)^2 + (9-8.05)^2 + (7-8.05)^2 + (8-8.05)^2 + (9-8.05)^2 + (8-8.05)^2 + (8-8.05)^2 + (7-8.05)^2 + (10-8.05)^2 + (11-8.05)^2 + (9-8.05)^2 + (6-8.05)^2 + (8-8.05)^2 + (8-8.05)^2 + (9-8.05)^2 + (10-8.05)^2 + (10-8.05)^2 + (8-8.05)^2}{20} = \frac{54.95}{20} \approx 2.75$

1.2. Межгрупповая дисперсия:

$\sigma_{меж}^2 = \frac{\sum_{i=1}^{k} n_i(\bar{x}_i - \bar{x})^2}{k-1}$

где:

  • k - количество групп (в данном случае 3)
  • $\bar{x}$ - общее среднее

Сначала найдем общее среднее:

$\bar{x} = \frac{15 \cdot 6.27 + 20 \cdot 7.55 + 20 \cdot 8.05}{15+20+20} = \frac{94.05 + 151 + 161}{55} = \frac{406.05}{55} \approx 7.38$

$\sigma_{меж}^2 = \frac{15(6.27-7.38)^2 + 20(7.55-7.38)^2 + 20(8.05-7.38)^2}{3-1} = \frac{15(1.23) + 20(0.0289) + 20(0.4489)}{2} = \frac{18.45 + 0.578 + 8.978}{2} = \frac{27.006}{2} \approx 13.50$

1.3. Средняя из групповых (частных) дисперсий:

$\bar{\sigma}^2 = \frac{\sum_{i=1}^{k} \sigma_i^2}{k}$

$\bar{\sigma}^2 = \frac{3.40 + 2.25 + 2.75}{3} = \frac{8.4}{3} = 2.8$

2. Коэффициент детерминации:

Коэффициент детерминации показывает, какая доля общей дисперсии объясняется межгрупповой дисперсией.

$R^2 = \frac{\sigma_{меж}^2}{\sigma_{общая}^2}$

Общая дисперсия:

$\sigma_{общая}^2 = \frac{\sum_{i=1}^{k} (n_i - 1)\sigma_i^2}{\sum_{i=1}^{k} n_i - 1} + \sigma_{меж}^2$

$\sigma_{общая}^2 = \frac{(15-1)3.40 + (20-1)2.25 + (20-1)2.75}{15+20+20-1} + 13.50 = \frac{14 \cdot 3.40 + 19 \cdot 2.25 + 19 \cdot 2.75}{54} + 13.50 = \frac{47.6 + 42.75 + 52.25}{54} + 13.50 = \frac{142.6}{54} + 13.50 \approx 2.64 + 13.50 = 16.14$

$R^2 = \frac{13.50}{16.14} \approx 0.836$

Таким образом, коэффициент детерминации равен примерно 0.836, что означает, что около 83.6% общей дисперсии объясняется различиями между группами стажа.

thinking img
progress gif

Текст скопирован
Готово
Ошибка
×