Лабораторная работа По предмету: Эконометрика Скачать бесплатно



Лабораторная работа №2
По предмету: Эконометрика
Вариант 24


Задание
1. Постройте поле корреляции.
2. Постройте линейное уравнение парной регрессии.
3. Вычислите линейный коэффициент парной корреляции, проверьте его значимость.
4. Постройте доверительный интервал для линейного коэффициента парной корреляции.
5. Постройте нелинейные регрессионные модели (экспоненциальную и степенную).
6. Вычислите индекс парной корреляции для полученных уравнений регрессии и проверьте значимость параметров.
7. Выберите лучшее уравнение регрессии на основе средней ошибки аппроксимации.
8. Определите средний коэффициент эластичности.
9. Постройте интервальный прогноз для значения х = хmax для линейного уравнения регрессии.
10. Оцените статистическую значимость и надежность построенных моделей с помощью F-критерия Фишера.
11. На основе необходимых полученных значений выберите лучшее уравнение регрессии, сделайте выводы.
12. Оформите отчет о проделанной работе.

Данные
Номер Регион Среднемесячная номинальная начисленная заработная плата, рубль, значение показателя за год (у) Величина прожиточного минимума (х)
67 Эвенкийский авт.окpуг 17817,2 6057
68 Иркутская область 11103,1 3278
69 Усть-Ордынский авт.округ 5859,4 3080
70 Кемеровская область 10407,7 2881
71 Новосибирская область 9165,6 3326
72 Омская область 8866,6 3190
73 Томская область 11317,2 3470
74 Республика Саха (Якутия) 16167,5 5234
75 Приморский край 10903,1 4309
76 Хабаровский край 12887,6 4786
77 Амурская область 11110,8 4299
78 Магаданская область 17747,2 5320
79 Сахалинская область 18842,1 5762
80 Еврейская автономная 9529,1 3779
81 Чукотский авт.округ 25703 8137
сумма 197427,2 66908
среднее 13161,81333 4460,533333



Аналитическая записка.
1. Строим поле корреляции. Оно имеет следующий вид:


Судя по расположению точек, делаем предположение, что форма связи – линейная.

2. Строим линейное уравнение парной регрессии.


Для построения линейной регрессии используем встроенную функцию Microsoft Excel Сервис → Анализ данных → Регрессия.

В результате получим три таблицы:
Регрессионная статистика
Множественный R 0,952789836
R-квадрат 0,907808472
Нормированный R-квадрат 0,900716816
Стандартная ошибка 1612,894856
Наблюдения 15
Дисперсионный анализ Число степеней свободы Дисперсия Дисперсия на одну степень свободы Статистика Фишера
df SS MS F Значимость F
Регрессия 1 333011079,2 333011079,2 128,0107874 4,21911E-08
Остаток 13 33818587,62 2601429,817
Итого 14 366829666,9


Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение -1851,063856 1390,723609 -1,331007717 0,206059399 -4855,539545 1153,411833 -4855,53955 1153,411833
Переменная X 1 3,365713485 0,297477319 11,31418523 4,21911E-08 2,723052811 4,008374159 2,723052811 4,008374159

Используя данные таблицы «Дисперсионный анализ», запишем уравнение регрессии:
у = 3,3657х -1851,0639
Вывод: с увеличением среднемесячной номинальной начисленной заработной платы на душу населения на 1 руб, доля потребительских расходов на душу населения увеличивается в среднем на 3,37 %-ных пункта.

3. Вычислим линейный коэффициент парной корреляции, проверим его значимость.
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции .
Данные берем из таблицы «Регрессионная статистика».
Регрессионная статистика
Множественный R 0,952789836
R-квадрат 0,907808472
Нормированный R-квадрат 0,900716816
Стандартная ошибка 1612,894856
Наблюдения 15

Получили , это близко к 1, что означает наличие очень тесной зависимости величины прожиточного минимума от среднемесячной номинальной начисленной заработной платы на душу населения.
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Он характеризует долю дисперсии результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака.
.
Данные берем из таблицы «Регрессионная статистика».
Регрессионная статистика
Множественный R 0,952789836
R-квадрат 0,907808472
Нормированный R-квадрат 0,900716816
Стандартная ошибка 1612,894856
Наблюдения 15


У нас . Следовательно, уравнением регрессии объясняется 90,78% дисперсии результативного признака, а на долю прочих факторов приходится лишь 9,22% ее дисперсии (т.е. остаточная дисперсия). Величина коэффициента детерминации служит одним из критериев качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов, и, следовательно, линейная модель лучше аппроксимирует исходные данные.

4. Построим доверительный интервал для линейного коэффициента парной корреляции.
Доверительный интервал для линейного коэффициента парной корреляции определяется как .
. Фактическое значение t-критерия Стьюдента определяется как . Табличное значение составило 2,1604, что меньше фактического, следовательно, гипотезу о несущественности линейного коэффициента парной корреляции можно отклонить.
Границы доверительного интервала для линейного коэффициента парной корреляции составят: ± * = ±0,9078, Т.е. 0≤ ≤1,8156

5. построим нелинейные регрессионные модели (экспоненциальную и степенную).
Для построения этих моделей выбираем Диаграмма→Тип диаграммы Точечная. Затем, после того, как диаграмма будет построена, Диаграмма→Добавить линию тренда.
Для вычисления параметров экспоненциальной кривой в MS Exсel применяется встроенная функция ЛГРФПРИБЛ. Результаты выполнения этой функции:
0,000232954 4359,936792
3,05915E-05 0,143016962
0,8168366 0,165864246
57,97487819 13
1,594943858 0,357642324

Экспоненциальная модель:

Степенная модель: y = axb имеет вид



6. Вычислим индекс парной корреляции для полученных уравнений регрессии и проверим значимость параметров этих уравнений.
для экспоненциальной модели.
для степенной модели.
Для оценки статистической значимости коэффициентов регрессии применяется t-критерий Стьюдента и рассчитываются доверительные интервалы каждого из показателей. Согласно t-критерию выдвигается гипотеза H0 о случайной природе показателей, т.е. о незначимом их отличии от нуля. Чтобы оценить значимость отдельных параметров уравнения, необходимо определить по каждому из параметров его стандартную ошибку: ma, mb.
Для экспоненциальной модели:
ma =0,1430
mb =0,00003
0,000232954 4359,936792
3,05915E-05 0,143016962
0,8168366 0,165864246
57,97487819 13
1,594943858 0,357642324



tтабл – максимально возможное значение критерия под влиянием случайных факторов при данной степени свободы k=n-2 и уровне значимости α. tтабл =2,1604.
Вывод. Так как фактическое значение t-критериев превышает табличное, то гипотезу H0 о несущественности коэффициентов регрессии можно отклонить. Т.е. a и b не случайно отличаются от нуля и сформировались под влиянием систематически действующих факторов.

Для оценки параметров степенной модели используем данные следующей таблицы:
у х у пр у-у пр (у-упр)^2 (у-упр)^2/13 х^2 х-х ср (х-х ср)^2
17817,2 6057 18322,11 -504,91 335699717 19610,3199 36687249 1596,467 2548706
11103,1 3278 9188,313 1914,787 84425091 282031,558 10745284 -1182,53 1398385
5859,4 3080 8566,819 -2707,42 73390393,9 563855,351 9486400 -1380,53 1905872
10407,7 2881 7947,167 2460,533 63157459,3 465709,53 8300161 -1579,53 2494926
9165,6 3326 9339,692 -174,092 87229842,5 2331,38061 11062276 -1134,53 1287166
8866,6 3190 8911,501 -44,9009 79414848,4 155,083958 10176100 -1270,53 1614255
11317,2 3470 9795,444 1521,756 95950716,7 178134,026 12040900 -990,533 981156,3
16167,5 5234 15548,22 619,278 241747206 29500,4079 27394756 773,4667 598250,7
10903,1 4309 12495,18 -1592,08 156129415 194977,3 18567481 -151,533 22962,35
12887,6 4786 14060,38 -1172,78 197694282 105800,972 22905796 325,4667 105928,6
11110,8 4299 12462,58 -1351,78 155315997 140563,048 18481401 -161,533 26093,02
17747,2 5320 15835,69 1911,509 250769105 281066,71 28302400 859,4667 738683
18842,1 5762 17322,08 1520,016 300054599 177726,788 33200644 1301,467 1693815
9529,1 3779 10781,25 -1252,15 116235350 120606,107 14280841 -681,533 464487,7
25703 8137 25532,46 170,5385 651906592 2237,18198 66210769 3676,467 13516407
197427 66908 2889120613 2564305,76 3,28E+08 29397094
13161,8 4460,53

mb 0,29535
ma 12854,2
ta 8
tb 3,80603
ma =12854,2260
mb =0,2954


tтабл =2,1604.
Так как табличное значение t-критериев превышает фактическое, то гипотезу H0 о несущественности коэффициентов регрессии можно отклонить. Т.е. a и b не случайно отличаются от нуля и сформировались под влиянием систематически действующих факторов.

7. Выберем лучшее уравнение регрессии на основе средней ошибки аппроксимации.
Для оценки качества построенных моделей используем формулу расчета средней ошибки аппроксимации .
Для линейной модели:
Используем данные таблицы:
у х |(y-y пр)/у|
17817,2 6057 0,0402904
11103,1 3278 0,1730467
5859,4 3080 0,4532774
10407,7 2881 0,2461777
9165,6 3326 0,0193876
8866,6 3190 0,0021386
11317,2 3470 0,1315907
16167,5 5234 0,0248906
10903,1 4309 0,1603852
12887,6 4786 0,1062759
11110,8 4299 0,1356643
17747,2 5320 0,0953766
18842,1 5762 0,0689903
9529,1 3779 0,140503
25703 8137 0,0065071
197427,2 66908 1,8045022
13161,81333 4460,533333
А= 12,0300 - значение А немного больше области допустимых значений.

Для экспоненциальной модели:
Используем данные таблицы:
у х |(y-y пр)/у|
17817,2 6057 2,678021
11103,1 3278 0,963593
5859,4 3080 0,951991
10407,7 2881 0,981225
9165,6 3326 0,951846
8866,6 3190 0,961195
11317,2 3470 0,949235
16167,5 5234 0,101804
10903,1 4309 0,755142
12887,6 4786 0,503868
11110,8 4299 0,764078
17747,2 5320 0,04221
18842,1 5762 1,026487
9529,1 3779 0,893839
25703 8137 113,9373
197427,2 66908 126,4618
13161,81333 4460,533333 2,678021
А= 8,4308- значение А попадает в область допустимых значений.

Для степенной модели:
Используем данные таблицы:
номер регион у х у пр у-у пр |(y-y пр)/у|
67 Эвенкийский авт.окpуг 17817,2 6057 18322,11 -504,91 0,025378
68 Иркутская область 11103,1 3278 9188,313 1914,787 0,174837
69 Усть-Ордынский авт.округ 5859,4 3080 8566,819 -2707,42 0,457856
70 Кемеровская область 10407,7 2881 7947,167 2460,533 0,238613
71 Новосибирская область 9165,6 3326 9339,692 -174,092 0,016061
72 Омская область 8866,6 3190 8911,501 -44,9009 0,002171
73 Томская область 11317,2 3470 9795,444 1521,756 0,136955
74 Республика Саха (Якутия) 16167,5 5234 15548,22 619,278 0,041072
75 Приморский край 10903,1 4309 12495,18 -1592,08 0,142722
76 Хабаровский край 12887,6 4786 14060,38 -1172,78 0,08786
77 Амурская область 11110,8 4299 12462,58 -1351,78 0,118435
78 Магаданская область 17747,2 5320 15835,69 1911,509 0,110276
79 Сахалинская область 18842,1 5762 17322,08 1520,016 0,083318
80 Еврейская автономная 9529,1 3779 10781,25 -1252,15 0,128146
81 Чукотский авт.округ 25703 8137 25532,46 170,5385 0,009494
сумма 197427,2 66908 1,773195
средние 13161,81 4460,533 A= 11,8213
А= 11,8213 - значение А попадает в область допустимых значений.

По проведенным расчетам можно сделать вывод, что экспоненциальная модель самая точная (А=8,4308), затем степенная, т.к. имеет меньшее значение средней ошибки аппроксимации (А= 11,8213). Менее точная линейная (A= 12,0300).

8. Определим средний коэффициент эластичности.
Определим коэффициент эластичности для линейной функции y=a+bx
Первая производная ух’=b,
Определим коэффициент эластичности для степенной функции y = axb
Первая производная ух’=abxb-1,
Определим коэффициент эластичности для экспоненциальной функции y = aеbх
Первая производная ух’=lnb a bx,
Сравнивая значения , делаем вывод, что наибольший коэффициент эластичности принадлежит линейной модели ( = ), т.е. здесь при изменении среднемесячной номинальной заработной платы на 1%, величина прожиточного минимума изменяются в раз. Меньшая эластичность присуща степенной модели, еще более меньшая – экспоненциальной.

9. Построим интервальный прогноз для значения х = хmax для линейного уравнения регрессии.
В прогнозных расчетах по уравнению регрессии определяется предсказываемое (ур) значение как точечный прогноз ух пр при хр=хk, т.е. путем подставления в уравнение регрессии ух пр =а+bх соответствующего значения х. Однако точечный прогноз явно нереален. Поэтому от дополняется расчетом стандартной ошибки ух пр, т.е. , и, соответственно, интервальной оценкой прогнозного значения (у*):
ух пр - ≤ у* ≤ ух пр + .
имеет выражение:
Данные берем из следующей таблицы:
номер регион у х y^2 х-х ср
67 Эвенкийский авт.окpуг 17817,2 6057 317452616 2548705,8
68 Иркутская область 11103,1 3278 123278830 1398385,1
69 Усть-Ордынский авт.округ 5859,4 3080 34332568 1905872,3
70 Кемеровская область 10407,7 2881 108320219 2494925,6
71 Новосибирская область 9165,6 3326 84008223 1287165,9
72 Омская область 8866,6 3190 78616596 1614255
73 Томская область 11317,2 3470 128079016 981156,28
74 Республика Саха (Якутия) 16167,5 5234 261388056 598250,68
75 Приморский край 10903,1 4309 118877590 22962,351
76 Хабаровский край 12887,6 4786 166090234 105928,55
77 Амурская область 11110,8 4299 123449877 26093,018
78 Магаданская область 17747,2 5320 314963108 738682,95
79 Сахалинская область 18842,1 5762 355024732 1693815,5
80 Еврейская автономная 9529,1 3779 90803747 464487,68
81 Чукотский авт.округ 25703 8137 660644209 13516407
сумма 197427 66908 2,965E+09 29397094
среднее 13161,8 4460,5333 197688641
сигма у 4945,23115
Итак, в нашем случае составит .
При хk= хmax= 8137 .
Для прогнозного значения 95%-ные доверительные интервалы составят
, т.е. или .
При хk=8137 прогнозное значение у составит: у=-1851,0639+3,3657*8137=25535,7468, которое представляет собой точечный прогноз.
Прогноз линии регрессии в интервале составит: 23665,2640 ≤ ≤ 27406,2280
10. Оценим статистическую значимость и надежность построенных моделей с помощью F-критерия Фишера.
Для линейной модели:
Фактическое значение F критерия Фишера возьмем из таблицы «Дисперсионный анализ»:
Дисперсионный анализ Число степеней свободы Дисперсия Дисперсия на одну степень свободы Статистика Фишера
df SS MS F Значимость F
Регрессия 1 333011079,2 333011079,2 128,0107874 4,21911E-08
Остаток 13 33818587,62 2601429,817
Итого 14 366829666,9
Fфакт.= 128,01078. Табличные значения F-критерия Фишера найдем с помощью встроенной функции Microsoft Excel FРАСПОБР с параметрами k1= 1, k2 = 15 – 1 – 1 = 13 и соответствующим уровнем значимости.
В результате Fтабл=128,01077, Fфакт > Fтабл, делаем вывод о значимости уравнения при заданных уровнях значимости и существенной связи.

Для степенной модели:
Используем формулу: , где R2 – индекс детерминации, n-число наблюдений, m – число параметров при переменных х. Табличные значения F-критерия Фишера найдем с помощью встроенной функции Microsoft Excel FРАСПОБР с параметрами k1= 1, k2 = 15 – 1 – 1 = 13 и соответствующим уровнем значимости.
Fфактич= 9,8436, Fтабл= 4,6672 при уровне значимости α=0,05. Fфактич> Fтабл, следовательно, связь существенная.

Для экспоненциальной модели:
Используем данные таблицы
1,000233 4359,936792
3,06E-05 0,143016962
0,816837 0,165864246
57,97488 13
1,594944 0,357642324

Fфактич= 57,97488, Fтабл= 4,6672 при уровне значимости α=0,05. Fфактич> Fтабл, следовательно связь существенная.

11. На основе полученных значений выберем лучшее уравнение регрессии.
По значениям характеристик, рассчитанных в 3, 4, 6, 7, 8 и 10 пунктах, можно сделать следующий вывод. Наиболее верно зависимость величины прожиточного минимума от среднемесячной номинальной начисленной заработной платы отражает линейная модель, т.к. ей принадлежит самые большие значения коэффициента детерминации (R2=0,9078) и коэффициента эластичности (Э=1,1406), однако значение средней ошибки аппроксимации немного превышает область допустимых значений (A=12,0300). Менее точно данную зависимость отражает степенная модель (R2=0,8203, Э=1,1241, А=11,8213). Самая неточная модель – экспоненциальная (R2=0,8168, Э=1,0390, А=8,4030).
 


Скачать одним архивом (бесплатно):




Использование материалов сайта с целью размещения на сторонних ресурсах ЗАПРЕЩЕНО


Не подходит работа? Нет материала? Не знаешь как сделать? Воспользуйся работой на заказ!

/td