Контрольная работа: Парная регрессия
Контрольная работа: Парная регрессия
Смысл
регрессионного анализа – построение функциональных зависимостей между двумя
группами переменных величин Х1, Х2, … Хр и Y.
При этом речь идет о влиянии переменных Х (это будут аргументы функций) на
значения переменной Y (значение функции). Переменные Х мы будем называть
факторами, а Y – откликом.
Наиболее
простой случай – установление зависимости одного отклика y от одного фактора х.
Такой случай называется парной (простой) регрессией.
Парная регрессия – уравнение
связи двух переменных у и x:
,
где у – зависимая переменная (результативный признак);
х – независимая, объясняющая
переменная (признак-фактор).
Различают линейные и нелинейные регрессии.
Линейная регрессия:.
Нелинейные регрессии делятся на
два класса: регрессии, нелинейные относительно включенных в анализ объясняющих
переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по
оцениваемым параметрам.
Регрессии, нелинейные по объясняющим переменным:
• полиномы разных степеней
•равносторонняя гипербола
Регрессии, нелинейные по оцениваемым параметрам:
•
степенная ;
•
показательная
•
экспоненциальная
Построение уравнения регрессии сводится к оценке ее параметров.
Для оценки параметров регрессий, линейных по параметрам, используют метод
наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров,
при которых сумма квадратов отклонений фактических значений результативного
признака у от теоретических минимальна, т.е.
Для линейных и нелинейных уравнений, приводимых к линейным,
решается следующая система относительно а и b:
Можно воспользоваться готовыми формулами, которые вытекают из этой
системы:
Тесноту связи изучаемых явлений оценивает линейный коэффициент
парной корреляции для линейной регрессии
и индекс корреляции - для нелинейной регрессии
():
Оценку качества построенной модели даст коэффициент (индекс)
детерминации, а также средняя ошибка аппроксимации.
Средняя ошибка аппроксимации – среднее
отклонение расчетных значений от фактических:
Допустимый предел значений – не
более 8 – 10%.
Средний коэффициент эластичности показывает, на сколько процентов в
среднем по совокупности изменится результат у от своей средней величины
при изменении фактора x на 1% от своего среднего
значения:
Задача дисперсионного анализа состоит в анализе дисперсии
зависимой переменной:
где – общая сумма квадратов отклонений;
– сумма квадратов отклонений, обусловленная
регрессией («объясненная» или «факторная»);
– остаточная сумма квадратов отклонений.
Долю дисперсии, объясняемую регрессией, в общей дисперсии
результативного признака у характеризует коэффициент (индекс)
детерминации R2:
Коэффициент детерминации – квадрат коэффициента или индекса
корреляции.
F-тест – оценивание качества уравнения регрессии – состоит в проверке
гипотезы Но о статистической незначимости уравнения
регрессии и показателя тесноты связи. Для этого выполняется
сравнение фактического Fфакт и критического (табличного)
Fтабл
значений F-критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной
дисперсий, рассчитанных на одну степень свободы:
п – число единиц совокупности;
т – число параметров при
переменных х.
Fтабл – это максимально возможное значение критерия под влиянием
случайных факторов при данных степенях свободы и уровне значимости а. Уровень
значимости а – вероятность отвергнуть правильную гипотезу при условии, что она
верна. Обычно а принимается равной 0,05 или 0,01.
Если Fтабл < Fфакт, то H0 – гипотеза о случайной
природе оцениваемых характеристик отклоняется и признается их статистическая
значимость и надежность. Если Fтабл > Fфакт, то гипотеза Н0 не отклоняется и признается
статистическая незначимость, ненадежность уравнения регрессии.
Для оценки статистической значимости коэффициентов регрессии и
корреляции рассчитываются t-критерий Стьюдента и доверительные
интервалы каждого из показателей. Выдвигается гипотеза Н0 о
случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка
значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента проводится путем
сопоставления их значений с величиной случайной ошибки:
Случайные ошибки параметров
линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и критическое (табличное) значения t-статистики – tтабл и tфакт – принимаем или отвергаем гипотезу Hо.
Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством
Если tтабл < tфакт, то Hо отклоняется, т.е. а, b и не случайно отличаются от
нуля и сформировались под влиянием систематически действующего фактора х. Если
tтабл > tфакт, то гипотеза Но
не отклоняется и признается случайная природа формирования a, b или .
Для расчета доверительного интервала определяем предельную
ошибку ∆ для каждого показателя:
Формулы для расчета доверительных интервалов имеют
следующий вид:
Если в границы доверительного интервала попадает ноль, т.е. нижняя
граница отрицательна, а верхняя положительна, то оцениваемый параметр
принимается нулевым, так как он не может одновременно принимать и
положительное, и отрицательное значения.
Прогнозное значение определяется
путем подстановки в уравнение регрессии соответствующего
(прогнозного) значения . Вычисляется средняя стандартная
ошибка прогноза :
где
и строится доверительный интервал прогноза:
где
Задача:
По 22
регионам страны изучается зависимость розничной продажи телевизоров, y от среднедушевых денежных доходов в
месяц, x (табл. 1):
№ региона |
X |
Y |
1,000 |
2,800 |
28,000 |
2,000 |
2,400 |
21,300 |
3,000 |
2,100 |
21,000 |
4,000 |
2,600 |
23,300 |
5,000 |
1,700 |
15,800 |
6,000 |
2,500 |
21,900 |
7,000 |
2,400 |
20,000 |
8,000 |
2,600 |
22,000 |
9,000 |
2,800 |
23,900 |
10,000 |
2,600 |
26,000 |
11,000 |
2,600 |
24,600 |
12,000 |
2,500 |
21,000 |
13,000 |
2,900 |
27,000 |
14,000 |
2,600 |
21,000 |
15,000 |
2,200 |
24,000 |
16,000 |
2,600 |
34,000 |
17,000 |
3,300 |
31,900 |
19,000 |
3,900 |
33,000 |
20,000 |
4,600 |
35,400 |
21,000 |
3,700 |
34,000 |
22,000 |
3,400 |
31,000 |
Задание
1.
Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2.
Рассчитайте параметры уравнений линейной, степенной,
экспоненциальной, полулогарифмической, обратной, гиперболической парной
регрессий.
3.
Оцените тесноту связи с помощью показателей корреляции и
детерминации.
4.
С помощью среднего (общего) коэффициента эластичности дайте
сравнительную оценку силы связи фактора с результатом.
5.
Качество уравнений оцените с помощью средней ошибки аппроксимации.
6.
С помощью F-критерия Фишера определите статистическую надежность результатов
регрессионного моделирования. Выберите лучшее уравнение регрессии и дайте его
обоснование.
7.
Рассчитайте прогнозное значение результата по линейному уравнению регрессии,
если прогнозное значение фактора увеличится на 7% от его среднего уровня.
Определите доверительный интервал прогноза для уровня значимости α=0,05.
8.
Оцените полученные результаты, выводы оформите в аналитической
записке.
1. Поле корреляции для:
·
Линейной регрессии y=a+b*x:
·
Гипотеза о
форме связи: чем больше размер среднедушевого денежного дохода в месяц
(факторный признак), тем больше при прочих равных условиях розничная продажа
телевизоров (результативный признак). В данной модели параметр b называется коэффициентом
регрессии и показывает, насколько в среднем отклоняется величина
результативного признака у при отклонении величины факторного признаках на одну
единицу.
·
Степенной регрессии :
Гипотеза о
форме связи: степенная функция имеет
вид Y=axb.
Параметр b
степенного уравнения называется показателем эластичности и указывает, на
сколько процентов изменится у при возрастании х на 1%. При х = 1 a = Y.
·
Экспоненциальная регрессия :
·
Равносторонняя гипербола :
Гипотеза о
форме связи: В ряде случаев обратная
связь между факторным и результативным признаками может быть выражена
уравнением гиперболы: Y=a+b/x.
·
Обратная гипербола :
·
Полулогарифмическая регрессия :
2. Рассчитайте
параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической,
обратной, гиперболической парной регрессий.
·
Рассчитаем параметры уравнений линейной парной регрессии. Для
расчета параметров a и b линейной регрессии y=a+b*x решаем систему нормальных уравнений относительно a и b:
По исходным
данным рассчитываем ∑y, ∑x, ∑yx, ∑x2, ∑y2 (табл. 2):
№ региона |
X |
Y |
XY |
X^2 |
Y^2 |
Y^cp |
Y-Y^cp |
Ai |
1 |
2,800 |
28,000 |
78,400 |
7,840 |
784,000 |
25,719 |
2,281 |
0,081 |
2 |
2,400 |
21,300 |
51,120 |
5,760 |
453,690 |
22,870 |
-1,570 |
0,074 |
3 |
2,100 |
21,000 |
44,100 |
4,410 |
441,000 |
20,734 |
0,266 |
0,013 |
4 |
2,600 |
23,300 |
60,580 |
6,760 |
542,890 |
24,295 |
-0,995 |
0,043 |
5 |
1,700 |
15,800 |
26,860 |
2,890 |
249,640 |
17,885 |
-2,085 |
0,132 |
6 |
2,500 |
21,900 |
54,750 |
6,250 |
479,610 |
23,582 |
-1,682 |
0,077 |
7 |
2,400 |
20,000 |
48,000 |
5,760 |
400,000 |
22,870 |
-2,870 |
0,144 |
8 |
2,600 |
22,000 |
57,200 |
6,760 |
484,000 |
24,295 |
-2,295 |
0,104 |
9 |
2,800 |
23,900 |
66,920 |
7,840 |
571,210 |
25,719 |
-1,819 |
0,076 |
10 |
2,600 |
26,000 |
67,600 |
6,760 |
676,000 |
24,295 |
1,705 |
0,066 |
11 |
2,600 |
24,600 |
63,960 |
6,760 |
605,160 |
24,295 |
0,305 |
0,012 |
12 |
2,500 |
21,000 |
52,500 |
6,250 |
441,000 |
23,582 |
-2,582 |
0,123 |
13 |
2,900 |
27,000 |
78,300 |
8,410 |
729,000 |
26,431 |
0,569 |
0,021 |
14 |
2,600 |
21,000 |
54,600 |
6,760 |
441,000 |
24,295 |
-3,295 |
0,157 |
15 |
2,200 |
24,000 |
52,800 |
4,840 |
576,000 |
21,446 |
2,554 |
0,106 |
16 |
2,600 |
34,000 |
88,400 |
6,760 |
1156,000 |
24,295 |
9,705 |
0,285 |
17 |
3,300 |
31,900 |
105,270 |
10,890 |
1017,610 |
29,280 |
2,620 |
0,082 |
19 |
3,900 |
33,000 |
128,700 |
15,210 |
1089,000 |
33,553 |
-0,553 |
0,017 |
20 |
4,600 |
35,400 |
162,840 |
21,160 |
1253,160 |
38,539 |
-3,139 |
0,089 |
21 |
3,700 |
34,000 |
125,800 |
13,690 |
1156,000 |
32,129 |
1,871 |
0,055 |
22 |
3,400 |
31,000 |
105,400 |
11,560 |
961,000 |
29,992 |
1,008 |
0,033 |
Итого |
58,800 |
540,100 |
1574,100 |
173,320 |
14506,970 |
540,100 |
0,000 |
|
сред значение |
2,800 |
25,719 |
74,957 |
8,253 |
690,808 |
|
|
0,085 |
станд. откл |
0,643 |
5,417 |
|
|
|
|
|
|
Система
нормальных уравнений составит:
Ур-ие регрессии: = 5,777+7,122∙x. Данное уравнение показывает, что с
увеличением среднедушевого денежного дохода в месяц
на 1 тыс. руб. доля розничных продаж телевизоров повышается в среднем на 7,12%.
·
Рассчитаем параметры уравнений степенной парной регрессии.
Построению степенной модели предшествует процедура
линеаризации переменных. В примере линеаризация производится путем
логарифмирования обеих частей уравнения:
где
Для расчетов используем данные табл. 3:
№ рег |
X |
Y |
XY |
X^2 |
Y^2 |
Yp^cp |
y^cp |
1 |
1,030 |
3,332 |
3,431 |
1,060 |
11,104 |
3,245 |
25,67072 |
2 |
0,875 |
3,059 |
2,678 |
0,766 |
9,356 |
3,116 |
22,56102 |
3 |
0,742 |
3,045 |
2,259 |
0,550 |
9,269 |
3,004 |
20,17348 |
4 |
0,956 |
3,148 |
3,008 |
0,913 |
9,913 |
3,183 |
24,12559 |
5 |
0,531 |
2,760 |
1,465 |
0,282 |
7,618 |
2,827 |
16,90081 |
6 |
0,916 |
3,086 |
2,828 |
0,840 |
9,526 |
3,150 |
23,34585 |
7 |
0,875 |
2,996 |
2,623 |
0,766 |
8,974 |
3,116 |
22,56102 |
8 |
0,956 |
3,091 |
2,954 |
0,913 |
9,555 |
3,183 |
24,12559 |
9 |
1,030 |
3,174 |
3,268 |
1,060 |
10,074 |
3,245 |
25,67072 |
10 |
0,956 |
3,258 |
3,113 |
0,913 |
10,615 |
3,183 |
24,12559 |
11 |
0,956 |
3,203 |
3,060 |
0,913 |
10,258 |
3,183 |
24,12559 |
12 |
0,916 |
3,045 |
2,790 |
0,840 |
9,269 |
3,150 |
23,34585 |
13 |
1,065 |
3,296 |
3,509 |
1,134 |
10,863 |
3,275 |
26,4365 |
14 |
0,956 |
3,045 |
2,909 |
0,913 |
9,269 |
3,183 |
24,12559 |
15 |
0,788 |
3,178 |
2,506 |
0,622 |
10,100 |
3,043 |
20,97512 |
16 |
0,956 |
3,526 |
3,369 |
0,913 |
12,435 |
3,183 |
24,12559 |
17 |
1,194 |
3,463 |
4,134 |
1,425 |
11,990 |
3,383 |
29,4585 |
19 |
1,361 |
3,497 |
4,759 |
1,852 |
12,226 |
3,523 |
33,88317 |
20 |
1,526 |
3,567 |
5,443 |
2,329 |
12,721 |
3,661 |
38,90802 |
21 |
1,308 |
3,526 |
4,614 |
1,712 |
12,435 |
3,479 |
32,42145 |
22 |
1,224 |
3,434 |
4,202 |
1,498 |
11,792 |
3,408 |
30,20445 |
итого |
21,115 |
67,727 |
68,921 |
22,214 |
219,361 |
67,727 |
537,270 |
сред зн |
1,005 |
3,225 |
3,282 |
1,058 |
10,446 |
3,225 |
|
стан откл |
0,216 |
0,211 |
|
|
|
|
|
Рассчитаем С
и b:
Получим линейное уравнение: . Выполнив
его потенцирование, получим:
Подставляя
в данное уравнение фактические значения х, получаем теоретические
значения результата y.
·
Рассчитаем параметры уравнений экспоненциальной парной регрессии.
Построению экспоненциальной модели предшествует процедура
линеаризации переменных. В примере линеаризация производится путем
логарифмирования обеих частей уравнения:
где
Для расчетов используем данные табл. 4:
№ региона |
X |
Y |
XY |
X^2 |
Y^2 |
Yp |
y^cp |
1 |
2,800 |
3,332 |
9,330 |
7,840 |
11,104 |
3,225 |
25,156 |
2 |
2,400 |
3,059 |
7,341 |
5,760 |
9,356 |
3,116 |
22,552 |
3 |
2,100 |
3,045 |
6,393 |
4,410 |
9,269 |
3,034 |
20,777 |
4 |
2,600 |
3,148 |
8,186 |
6,760 |
9,913 |
3,170 |
23,818 |
5 |
1,700 |
2,760 |
4,692 |
2,890 |
7,618 |
2,925 |
18,625 |
6 |
2,500 |
3,086 |
7,716 |
6,250 |
9,526 |
3,143 |
23,176 |
7 |
2,400 |
2,996 |
7,190 |
5,760 |
8,974 |
3,116 |
22,552 |
8 |
2,600 |
3,091 |
8,037 |
6,760 |
9,555 |
3,170 |
23,818 |
9 |
2,800 |
3,174 |
8,887 |
7,840 |
10,074 |
3,225 |
25,156 |
10 |
2,600 |
3,258 |
8,471 |
6,760 |
10,615 |
3,170 |
23,818 |
11 |
2,600 |
3,203 |
8,327 |
6,760 |
10,258 |
3,170 |
23,818 |
12 |
2,500 |
3,045 |
7,611 |
6,250 |
9,269 |
3,143 |
23,176 |
13 |
2,900 |
3,296 |
9,558 |
8,410 |
10,863 |
3,252 |
25,853 |
14 |
2,600 |
3,045 |
7,916 |
6,760 |
9,269 |
3,170 |
23,818 |
15 |
2,200 |
3,178 |
6,992 |
4,840 |
10,100 |
3,061 |
21,352 |
16 |
2,600 |
3,526 |
9,169 |
6,760 |
12,435 |
3,170 |
23,818 |
17 |
3,300 |
3,463 |
11,427 |
10,890 |
11,990 |
3,362 |
28,839 |
19 |
3,900 |
3,497 |
13,636 |
15,210 |
12,226 |
3,526 |
33,978 |
20 |
4,600 |
3,567 |
16,407 |
21,160 |
12,721 |
3,717 |
41,140 |
21 |
3,700 |
3,526 |
13,048 |
13,690 |
12,435 |
3,471 |
32,170 |
22 |
3,400 |
3,434 |
11,676 |
11,560 |
11,792 |
3,389 |
29,638 |
Итого |
58,800 |
67,727 |
192,008 |
173,320 |
219,361 |
67,727 |
537,053 |
сред зн |
2,800 |
3,225 |
9,143 |
8,253 |
10,446 |
|
|
стан откл |
0,643 |
0,211 |
|
|
|
|
|
Рассчитаем
С и b:
Получим линейное уравнение: . Выполнив
его потенцирование, получим:
Для расчета
теоретических значений y подставим в уравнение значения x.
·
Рассчитаем параметры уравнений полулогарифмической парной
регрессии. Построению полулогарифмической модели предшествует
процедура линеаризации переменных. В примере линеаризация производится путем
замены:
где
Для расчетов используем данные табл. 5:
№ региона |
X |
Y |
XY |
X^2 |
Y^2 |
y^cp |
1 |
1,030 |
28,000 |
28,829 |
1,060 |
784,000 |
26,238 |
2 |
0,875 |
21,300 |
18,647 |
0,766 |
453,690 |
22,928 |
3 |
0,742 |
21,000 |
15,581 |
0,550 |
441,000 |
20,062 |
4 |
0,956 |
23,300 |
22,263 |
0,913 |
542,890 |
24,647 |
5 |
0,531 |
15,800 |
8,384 |
0,282 |
249,640 |
15,525 |
6 |
0,916 |
21,900 |
20,067 |
0,840 |
479,610 |
23,805 |
7 |
0,875 |
20,000 |
17,509 |
0,766 |
400,000 |
22,928 |
8 |
0,956 |
22,000 |
21,021 |
0,913 |
484,000 |
24,647 |
9 |
1,030 |
23,900 |
24,608 |
1,060 |
571,210 |
26,238 |
10 |
0,956 |
26,000 |
24,843 |
0,913 |
676,000 |
24,647 |
11 |
0,956 |
24,600 |
23,506 |
0,913 |
605,160 |
24,647 |
12 |
0,916 |
21,000 |
19,242 |
0,840 |
441,000 |
23,805 |
13 |
1,065 |
27,000 |
28,747 |
1,134 |
729,000 |
26,991 |
14 |
0,956 |
21,000 |
20,066 |
0,913 |
441,000 |
24,647 |
15 |
0,788 |
24,000 |
18,923 |
0,622 |
576,000 |
21,060 |
16 |
0,956 |
34,000 |
32,487 |
0,913 |
1156,000 |
24,647 |
17 |
1,194 |
31,900 |
38,086 |
1,425 |
1017,610 |
29,765 |
19 |
1,361 |
33,000 |
44,912 |
1,852 |
1089,000 |
33,351 |
20 |
1,526 |
35,400 |
54,022 |
2,329 |
1253,160 |
36,895 |
21 |
1,308 |
34,000 |
44,483 |
1,712 |
1156,000 |
32,221 |
22 |
1,224 |
31,000 |
37,937 |
1,498 |
961,000 |
30,406 |
Итого |
21,115 |
540,100 |
564,166 |
22,214 |
14506,970 |
540,100 |
сред зн |
1,005 |
25,719 |
26,865 |
1,058 |
690,808 |
|
стан откл |
0,216 |
5,417 |
|
|
|
|
Рассчитаем a и b:
Получим линейное уравнение: .
·
Рассчитаем параметры уравнений обратной парной регрессии. Для
оценки параметров приведем обратную модель к
линейному виду, заменив , тогда
Для расчетов используем данные табл. 6:
№ региона |
X |
Y |
XY |
X^2 |
Y^2 |
Y^cp |
1 |
2,800 |
0,036 |
0,100 |
7,840 |
0,001 |
24,605 |
2 |
2,400 |
0,047 |
0,113 |
5,760 |
0,002 |
22,230 |
3 |
2,100 |
0,048 |
0,100 |
4,410 |
0,002 |
20,729 |
4 |
2,600 |
0,043 |
0,112 |
6,760 |
0,002 |
23,357 |
5 |
1,700 |
0,063 |
0,108 |
2,890 |
0,004 |
19,017 |
6 |
2,500 |
0,046 |
0,114 |
6,250 |
0,002 |
22,780 |
7 |
2,400 |
0,050 |
0,120 |
5,760 |
0,003 |
22,230 |
8 |
2,600 |
0,045 |
0,118 |
6,760 |
0,002 |
23,357 |
9 |
2,800 |
0,042 |
0,117 |
7,840 |
0,002 |
24,605 |
10 |
2,600 |
0,038 |
0,100 |
6,760 |
0,001 |
23,357 |
11 |
2,600 |
0,041 |
0,106 |
6,760 |
0,002 |
23,357 |
12 |
2,500 |
0,048 |
0,119 |
6,250 |
0,002 |
22,780 |
13 |
2,900 |
0,037 |
0,107 |
8,410 |
0,001 |
25,280 |
14 |
2,600 |
0,048 |
0,124 |
6,760 |
0,002 |
23,357 |
15 |
2,200 |
0,042 |
0,092 |
4,840 |
0,002 |
21,206 |
16 |
2,600 |
0,029 |
0,076 |
6,760 |
0,001 |
23,357 |
17 |
3,300 |
0,031 |
0,103 |
10,890 |
0,001 |
28,398 |
19 |
3,900 |
0,030 |
0,118 |
15,210 |
0,001 |
34,844 |
20 |
4,600 |
0,028 |
0,130 |
21,160 |
0,001 |
47,393 |
21 |
3,700 |
0,029 |
0,109 |
13,690 |
0,001 |
32,393 |
22 |
3,400 |
0,032 |
0,110 |
11,560 |
0,001 |
29,301 |
Итого |
58,800 |
0,853 |
2,296 |
173,320 |
0,036 |
537,933 |
сред знач |
2,800 |
0,041 |
0,109 |
8,253 |
0,002 |
|
стан отклон |
0,643 |
0,009 |
|
|
|
|
Рассчитаем a и b:
Получим линейное уравнение: . Выполнив
его потенцирование, получим:
Для расчета
теоретических значений y подставим в уравнение значения
x.
·
Рассчитаем параметры уравнений равносторонней гиперболы парной
регрессии. Для оценки параметров приведем модель равносторонней гиперболы к линейному виду, заменив , тогда
Для расчетов используем данные табл. 7:
№ региона |
X=1/z |
Y |
XY |
X^2 |
Y^2 |
Y^cp |
1 |
0,357 |
28,000 |
10,000 |
0,128 |
784,000 |
26,715 |
2 |
0,417 |
21,300 |
8,875 |
0,174 |
453,690 |
23,259 |
3 |
0,476 |
21,000 |
10,000 |
0,227 |
441,000 |
19,804 |
4 |
0,385 |
23,300 |
8,962 |
0,148 |
542,890 |
25,120 |
5 |
0,588 |
15,800 |
9,294 |
0,346 |
249,640 |
13,298 |
6 |
0,400 |
21,900 |
8,760 |
0,160 |
479,610 |
24,227 |
7 |
0,417 |
20,000 |
8,333 |
0,174 |
400,000 |
23,259 |
8 |
0,385 |
22,000 |
8,462 |
0,148 |
484,000 |
25,120 |
9 |
0,357 |
23,900 |
8,536 |
0,128 |
571,210 |
26,715 |
10 |
0,385 |
26,000 |
10,000 |
0,148 |
676,000 |
25,120 |
11 |
0,385 |
24,600 |
9,462 |
0,148 |
605,160 |
25,120 |
12 |
0,400 |
21,000 |
8,400 |
0,160 |
441,000 |
24,227 |
13 |
0,345 |
27,000 |
9,310 |
0,119 |
729,000 |
27,430 |
14 |
0,385 |
21,000 |
8,077 |
0,148 |
441,000 |
25,120 |
15 |
0,455 |
24,000 |
10,909 |
0,207 |
576,000 |
21,060 |
16 |
0,385 |
34,000 |
13,077 |
0,148 |
1156,000 |
25,120 |
17 |
0,303 |
31,900 |
9,667 |
0,092 |
1017,610 |
29,857 |
19 |
0,256 |
33,000 |
8,462 |
0,066 |
1089,000 |
32,564 |
20 |
0,217 |
35,400 |
7,696 |
0,047 |
1253,160 |
34,829 |
21 |
0,270 |
34,000 |
9,189 |
0,073 |
1156,000 |
31,759 |
22 |
0,294 |
31,000 |
9,118 |
0,087 |
961,000 |
30,374 |
Итого |
7,860 |
540,100 |
194,587 |
3,073 |
14506,970 |
540,100 |
сред знач |
0,374 |
25,719 |
9,266 |
0,146 |
1318,815 |
|
стан отклон |
0,079 |
25,639 |
|
|
|
|
Рассчитаем a и b:
Получим линейное уравнение: . Получим
уравнение регрессии: .
3. Оценка
тесноты связи с помощью показателей корреляции и детерминации:
·
Линейная модель. Тесноту линейной связи оценит коэффициент
корреляции. Был получен следующий коэффициент корреляции rxy=b=7,122*, что говорит о прямой сильной связи фактора
и результата. Коэффициент детерминации r²xy=(0,845)²=0,715. Это
означает, что 71,5% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
·
Степенная модель. Тесноту нелинейной связи оценит индекс
корреляции. Был получен следующий индекс корреляции =, что говорит о очень сильной тесной связи, но немного больше чем
в линейной модели. Коэффициент детерминации r²xy=0,7175. Это означает, что 71,75%
вариации результативного признака (розничная
продажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в
месяц.
·
Экспоненциальная модель. Был получен следующий индекс корреляции ρxy=0,8124, что говорит о том,
что связь прямая и очень сильная, но немного слабее, чем в линейной и степенной
моделях. Коэффициент детерминации r²xy=0,66. Это означает, что 66% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
·
Полулогарифмическая модель. Был получен следующий индекс
корреляции ρxy=0,8578, что говорит о том, что связь прямая и очень сильная, но
немного больше чем в предыдущих моделях. Коэффициент детерминации r²xy=0,7358. Это означает, что 73,58%
вариации результативного признака (розничная
продажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в
месяц.
·
Гиперболическая модель. Был получен следующий индекс корреляции ρxy=0,8448 и коэффициент
корреляции rxy=-0,1784 что говорит о том, что связь обратная очень сильная.
Коэффициент детерминации r²xy=0,7358. Это означает, что 73,5% вариации результативного признака
(розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
·
Обратная модель. Был получен следующий индекс корреляции ρxy=0,8114 и коэффициент
корреляции rxy=-0,8120, что говорит о том, что связь обратная очень сильная.
Коэффициент детерминации r²xy=0,6584. Это означает, что 65,84% вариации результативного
признака (розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
Вывод: по полулогарифмическому
уравнению получена наибольшая оценка тесноты связи: ρxy=0,8578 (по сравнению с
линейной, степенной, экспоненциальной,
гиперболической, обратной регрессиями).
4. С
помощью среднего (общего) коэффициента эластичности дайте сравнительную оценку
силы связи фактора с результатом.
Рассчитаем
коэффициент эластичности для линейной модели:
·
Для уравнения прямой: y = 5,777+7,122∙x
·
Для уравнения степенной модели :
·
Для уравнения экспоненциальной модели:
Для
уравнения полулогарифмической модели :
·
Для уравнения обратной
гиперболической модели :
·
Для уравнения равносторонней
гиперболической модели :
Сравнивая значения , характеризуем оценку силы связи фактора с
результатом:
·
·
·
·
·
·
Известно, что коэффициент эластичности показывает связь между
фактором и результатом, т.е. на сколько% изменится результат y от своей средней величины
при изменении фактора х на 1% от своего среднего значения. В данном
примере получилось, что самая большая сила связи между фактором и результатом в полулогарифмической модели, слабая сила связи в обратной
гиперболической модели.
5. Оценка
качества уравнений с помощью средней ошибки аппроксимации.
Подставляя в уравнение регрессии фактические значения х, определим
теоретические (расчетные) значения . Найдем величину
средней ошибки аппроксимации :
В среднем расчетные значения отклоняются от фактических на:
·
Линейная регрессия. = *100%= 8,5%, что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
·
Степенная регрессия. =*100%= 8,2%, что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
·
Экспоненциальная регрессия. =*100%= 9%, что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
·
Полулогарифмическая регрессия. =*100%= 7,9 что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
·
Гиперболическая регрессия. =*100%= 9,3 что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
·
Обратная регрессия. =*100%= 9,9 3 что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
6. Рассчитаем F-критерий:
·
Линейная регрессия. = *19= 47,579
где =4,38<
·
Степенная регрессия. =*19= 48,257
где =4,38<
·
Экспоненциальная регрессия. =*19= 36,878
где =4,38<
·
Полулогарифмическая регрессия. =*19= 52,9232
где =4,38<
·
Гиперболическая регрессия. =*19= 47,357
где =4,38<
·
Обратная регрессия. =*19= 36,627
где =4,38<
Для всех регрессий =4,38< , из чего
следует, что уравнения регрессии статистически значимы.
Вывод: остается
на допустимом уровне для всех уравнений регрессий.
|
А |
R^2 |
Fфакт |
Линейная модель |
8,5 |
0,714 |
47,500 |
Степенная модель |
8,2 |
0,718 |
48,250 |
Полулогарифмическая модель |
7,9 |
0,736 |
52,920 |
Экспоненциальная модель |
9,0 |
0,660 |
36,870 |
Равносторонняя гипербола |
9,3 |
0,714 |
47,350 |
Обратная гипербола |
9,9 |
0,453 |
15,700 |
Все уравнения регрессии достаточно хорошо описывают исходные
данные. Некоторое предпочтение можно отдать полулогарифмической функции, для
которой значение R^2 наибольшее, а ошибка аппроксимации – наименьшая
7. Рассчитаем прогнозное значение результата по линейному
уравнению регрессии, если прогнозное значение фактора увеличится на 7% от его
среднего уровня. Определим доверительный интервал прогноза для уровня
значимости α=0,05:
Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения .
5,777+7,122*2,996=27,114
где = =2,8*1,07=2,996
Средняя стандартная ошибка прогноза :
==3,12
где = =0,697886
Предельная ошибка прогноза:
Доверительный интервал прогноза
где
=27,116,53;
27,11–6,53 = 20,58
27,11+6,53 = 33,64
Выполненный прогноз среднедушевых
денежных доходов в месяц, x оказался надежным (р = 1 – α
= 1 – 0,05 = 0,95), но неточным, так как диапазон верхней и нижней границ
доверительного интервала составляет 2,09 раза:
= = =1,63
|