velikol.ru
1 2 ... 4 5

Тема 1. Построение линейно-регрессионной модели экономического процесса.


Пусть имеются две измеренные случайные величины и . В результате проведения n измерений получено n пар независимых пар . Перед исследователем экономистом ставится задача построения математической модели. Построим математическую модель представленную в виде выборочного линейного уравнения регрессии с.в. на с.в. (в обратном случае рассуждения проводятся аналогично).

Общий вид линейного уравнения в общем виде представляется:

(1)

Используя выборочные значения мы можем получить только оценку параметров и из (1), т.е. получить уравнение:

(2)

где и это соответственно оценки параметров k и b уравнения (1).

Обозначим через значение величины , соответствующее , а через значение оценки , которое получается при .

Для построение адекватной регрессионной модели экономического процесса необходимо воспользоваться методом наименьших квадратов (МНК) для этого рассмотрим разность и построим функционал который необходимо оптимизировать относительно оценок параметров:

(3)

Используя необходимое условие экстремума, приравниваем частные производные по и к 0. Получаем систему уравнений для нахождения этих коэффициентов:

(4)

после преобразования получаем систему

(4/)

откуда после выражения получаем следующие значения параметров:



(5)



Аналогично находится выборочное уравнение линейной регрессии СВ. X на СВ Y, , в котором выражения для оценок параметров и аналогичны выражению (5).

Для оценки связи между случайными величинами обычно используется выборочный коэффициент корреляции, который определяет меру зависимости одной случайной величины от другой. Рассмотрим выборочный эмпирический корреляционный момент

(6)

где , - выборочные средние (математические ожидания) и преобразуя (6) с учетом выражений и , получаем

(6/)

Выборочный коэффициент корреляции с учетом (6/) есть

(7)

где , - выборочные среднеквадратичные дисперсии.

(8)

Геометрический смысл линейной регрессии усреднение по всей выборочной совокупности данных.


^ Рис.1 Линейная регрессионная модель и регрессионные поля 1 и 2

Ко всем выше перечисленным коэффициентам рассчитанным по выборочным совокупностям, можно отметить следующие имеющие значение для экономических приложений, см. таблицу

Таблица 1

Основные статистические показатели имеющие значение в экономических приложениях

Название параметра

Обозначение

Что характеризует параметр и для чего применяется

Оптимальное значение параметра

1.Объем выборки

m

Объем данных по фактору (размер матрицы по вертикали). Применяется для установления тенденций изменения фактора

Не менее чем в 3-5 раз больше числа факторов (nxi). С увеличением числа факторов кратность должна увеличиваться

2.Коэффициент вариации

Vi

Уровень отклонения значений факторов то средней анализируемой совокупности

Меньше 33%

3.Коэффициент парной корреляции

rxy

Тесноту связи между i-м фактором и функцией. Применяется для отбора факторов

Больше 0,1

4.Коэффициент частной корреляции

rxx

Тесноту связи между факторами. Применяется для отбора факторов

Чем меньше, тем лучше модель

5.Коэффициент множественной корреляции

R

Тесноту связи одновременно между всеми факторами и функцией. Применяется для выбора модели

Больше 0,7


6. Коэффициент множественной детерминации


D


Долю влияния на функцию включенных в модель факторов. Равен квадрату коэффициента множественной корреляции


Больше 0,5

7.Коэффициент асимметрии

A

Степень отклонения фактического распределения случайных наблюдений от нормального (по центру) распределения. Применяется для проверки нормальности распределения

Метод наименьших квадратов может применяться при А<3

8.Коэффициент эксцесса

E

Плосковершинность распределения случайных наблюдений от нормального (по центру) распределения. Применяется для проверки нормальности распределения

Меньше трех

9.Критерий Фишера

F

Математический критерий, характеризующий значимость уравнения регрессии. Применяется для выбора модели

Больше табличного значения, установленного для различных размеров матрицы и вероятностей

10.Критерий Стьюдента

t

Существенность факторов, входящих в модель.

Больше двух (при вероятности равной 0,95)

11.Средне-квадратическая ошибка коэффициентов регрессии

Δai

Точность полученных коэффициентов регрессии. Применяется для оценки коэффициентов регрессии

В два и более раза меньше соответствующего коэффициента регрессии

12.Ошибка аппроксимации

E

Допуск прогноза или степень несоответствия эмпирической зависимости теоретической. Применяется для оценки адекватности (точности) модели

Меньше (точнее) ±15%

13.Коэффициент эластичности

Эi

Показывает, на сколько процентов изменяется функция при изменении соответствующего фактора на 1%. Применяется для ранжирования факторов по их значимости

Больше 0,01


Пример

В магазине в течение пяти дней подсчитать число покупок товара X и товара Y. Статистика продаж бала представлена в табл.2.

Таблица 2

Статистика продаж

xi

10

20

25

28

30




yi

4

8

7

12

14


Построить линейную регрессионную модель экономического процесса.

С учетом выражения (5) для удобства вычислений обычно формируют таблицу промежуточных вычислений см. табл. 3.

Таблица 3

Промежуточные результаты



xi

yi

xi2

xi yi

yi2




1

10

4

100

40

16

2

20

8

400

160

64

3

25

7

625

175

49

4

28

12

784

336

144

5

30

14

900

420

196



113

45

2809

1131

469


Используя данные таблицы 3, вычислим коэффициенты линейно-регрессионной модели для примера №1.

коэффициенты линейно-регрессионного уравнения, относительно полученных коэффициентов получаем равнение .

Вычислим меру зависимости или корреляционный момент.



Выборочные дисперсии вычисляем исходя из значений



, следовательно выборочная корреляция .

Геометрический смысл и прогнозные значения.


Рис.2 Выборочные значения и средняя модель

Получено уравнение . Исходя из уравнения регрессии по входным значениям факторных переменных xi построим прогноз для значения xi=35 и xi=42 прогнозные значения yi соответственно будут 14,5 и 17,7.

Строим таблицу с основными (по условию задачи) и прогнозными значениями, таблица 4.

Таблица 4

Прогнозные значения (выделенные значения) по регрессионной модели

xi

10

20

25

28

30

35

42




yi

4

8

7

12

14

15

18



Задачи для контроля и самопроверки


Задача№1


Себестоимость 1000 м3 сжатого воздуха на заводе по годам за период с 1993 по 2000гг составила соответственно 2.1 | 2.03 | 1.95 | 2.02 | 1.86 | 1.87 | 1.83 | 1.8. Отобразить динамику изменения себестоимости выработки 1000 м3 на графике (построить полигон) и спрогнозировать значения себестоимости на 2001, 2002, 2003 гг, учитывая, что математическая модель, описывающая процесс, представлена в виде линейно-регрессионного уравнения вида (на том же графике построить уравнение модели)?


Задача№2


Необходимо выяснить, как изменится количество продаваемого товара, продаваемого ежедневно в розницу. Статистика продаж зафиксированная в определенный момент времени составила:


^ Количество проданного товара в день

28

29

34

35

37

37

41

46




Цена руб. за единицу

30

31

25

26

22

24

16

12


Требуется изобразить данные на графике, вычислить меру зависимости (выборочную корреляцию). Построить линейно-регрессионную модель. Построить прогноз, сколько единиц товара будет продано при цене 45 руб.?


Задача№3


Было проведено социальное исследование, были получены сведения о том, сколько зарабатывает население за месяц и сколько при этом каждый человек откладывает на «черный день». Для девяти случайно отобранных людей была получена следующая статистика:


^ Доход тыс. руб. в месяц

15

6

9

3

20

11

14

10

12




Сбережения

2000

200

500

500

2500

1800

1500

1500

1600


Требуется вычислить коэффициенты линейной регрессии, изобразить выборочные данные и уравнение на графике. Измерить тесноту линейной связи?


Задача№4


Одну из туристических фирм заинтересовал вопрос связи между числом посетителей отелей и расходами на их рекламу. Отделом маркетинга фирмы случайным образом для исследования было выбрано шесть отелей сходным по экономическим показателям. Была собрана следующая информация:


Отель

1

2

3

4

5

6




Расходы на рекламу

9000

6000

10000

8000

7000

4000

Число посетителей

1100

1200

1600

1300

1100

800


Построить модель маркетингового исследования. Оценить на сколько зависит число посетителей от расходов на рекламу?


Задача№5


Была собрана коммерческая информация по 12 магазинам. Перед аналитическим отделом поставлена задача оценка связи между годовой прибылью и оборотом денежных активов. Для анализа была представлена следующая информация:


Магазин

1

2

3

4

5

6

7

8

9

10

11

12




Годовая прибыль

2

4

11

17

18

28

34

36

48

55

71

85

Оборот

50

60

85

85

100

120

140

155

180

210

250

300


Постройте модель зависимости между прибылью и оборотом.


Задача№6


15 студентов сдали итоговый экзамен по бух. учету и математике. Их итоговые баллы представлены в таблице. Существует ли какая либо связь между этими двумя результатами:


Студент

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15




Бух. учет

10

5

12

1

6

2

7

11

15

3

9

14

13

4

8

Математика

13

4

10

1

11

2

8

9

14

5

7

12

15

3

6


Задача№7


Компания имеет большое количество продавцов, которые предъявили отчет о своих поездках. 10 из них предъявили требования на оплату этих поездок. За два квартала компания выплатила 17,5 руб. за каждый километр проезда?


Продавец

1

2

3

4

5

6

7

8

9

10




^ Пройдено км. в 1 квартале

28

26

35

20

30

16

40

36

24

25

Пройдено км. во 2 квартале

45

54

49

36

50

32

64

56

44

50


Рассчитать среднее значение издержек компании на возмещение затрат на поездки в каждом квартале. Определить линию регрессии для каждого квартала. Зависят ли издержки компании в 1 квартале от издержек во 2 квартале?

Задача№8


Маркетолог компании проанализировал время, затраченное на производство продукции. Данные для одного вида продукции (который был запущен в серийное производство) представлены в таблице:


^ Серия продукции

1

2

3

4

5

6

7

8

9

10




^ Объем серии продукции

32

24

30

45

15

26

50

18

20

40

Время на производство, ч

21,4

17,0

20,4

29,6

12,6

19,1

34,2

15,2

16,3

29,2


Данные расположены в хронологическом порядке по времени производства продукции за прошедший год. В результате исследования была определена регрессионная модель описывающая этот процесс, она имеет вид . Определите меру корреляции между объемом и временем. На сколько точен прогноз сделанный по модели?




следующая страница >>