Кореляційний і регресивний методи аналізу зв'язку
Кореляційний і регресивний
Методи аналізу зв'язку
Основне завдання кореляційного і регресійного методів полягає в аналізі статистичних даних для виявлення математичної залежності між досліджуваними ознаками і встановлення за допомогою коефіцієнта кореляції порівняльної оцінки щільності взаємозв'язку.
Після того, як через економічний аналіз встановлено, що зв'язок між явищами є, і визначено загальний характер цього зв'язку, статистика за допомогою кореляційного і регресійного методів надає цим зв'язкам числового виразу.
Кореляційний і регресійний методи аналізу вирішують два основні завдання:
- - визначають за допомогою рівнянь регресії аналітичного форму зв'язку між варіацією ознак X i Y, - встановлюють ступінь щільності зв'язку між ознаками.
Найчастіше трапляються такі типи кореляційних зв'язків:
- - факторна ознака безпосередньо пов'язана з результативною, - результативна ознака визначається комплексом діючих факторів, - дві результативні ознаки спричинені дією однієї загальної причини.
У практиці економіко-статистичних досліджень часто доводиться мати справу з прямолінійною формою зв'язку яку описує рівняння регресії (рис.1).
На цьому графіку середній арифметичній результативної ознаки Y відповідає пряма, паралельна осі абсцис, лінійне кореляційне рівняння Y(X) зображує похила пряма, а кут нахилу між ними характеризує щільність зв'язку.
Рівняння регресії характеризує зміну середнього рівня результативної ознаки Y залежно від зміни факторної ознаки X. Воно визначає математичне сподівання групових середніх результативної ознаки під впливом різних значень факторної ознаки.
У разі лінійної форми зв'яку результативна ознака зміняються під впливом факторної ознаки рівномірно:
Yx = a0 +a1 X,
Де, YX - згладжене середнє значення результативної ознаки, X - факторна ознака,
A0 і a1 - параметри рівняння, a0 - значення Y при X = 0, a1 - коефіцієнт регресії.
Коефіцієнт регресії a1, Вказує на те, наскільки змінюється результативна ознака Y внаслідок зміни факторної ознаки X на одиницю.
Якщо a1 Має позитивний знак, то зв'язок прямий, якщо від'ємний - зв'язок обернений.
Рис. 1. Теоретична лінія регресії
Параметри рівняння зв'язку визначають за способом найменших квадратів складеної і роз'язаної системи двох рівнянь з двома невідомими:
Y= na0 +a1 X,
YX= a0 X + a1 X 2,
Де n - число членів у кожному з двох порівнюваних рядів,
X - сума значень факторної ознаки, X 2 - сума квадратів значень факторної ознаки, Y - сума значень результативної ознаки, YX - cума добутків значень факторної та результативної ознак.
Розв'язавши дану систему рівнянь, дістанемо такі параметри:
X 2 Y - X XY n XY - X Y
A0 = , a1 = n X 2 - X X n X 2 - X X
Обчисливши за фактичними даними всі записані вище суми й підставивши їх у наведені формули, знайдемо параметри прямої.
Розглянемо розрахунок параметрів лінійного рівняння зв'язку між вартістю основних виробничих фондів і випуском продукції за даними десяти однорідних підприємств. (табл.1.)
Табл. 1. Розрахунки для визначення параметрів лінійного рівняння зв'язку факторної та результативної ознак.
Номер Заводу |
Вартість основних виробничих фондів X, Млн. грн |
Випуск продукції Y, млн. грн |
X 2 |
XY |
Y2 |
YX = 0.167+0.421X |
|
|
|
|
|
|
|
Разом |
108 |
47,2 |
1236 |
539,1 |
239,74 |
47,2 |
У середньому на один завод |
10,8 |
4,72 |
123,6 |
53,91 |
23,972 |
- |
Тоді лінійне рівняння регресії зв'язку між вартістю основних виробничих фондів і випуском продукції матиме такий вигляд :
YX = 0.167 + 0.421X.
Отже, при збільшенні вартості основних виробничих фондів на 1 млн. грн. Випуск продукції зросте на 0,42 млн. грн.
Послідовно підставляючи в дане рівняння значення факторної ознаки X, дістанемо згладжені значення результативної ознаки YX, які й укажуть на те, яким має бути середній розмір випущеної продукції для даного розміру основних виробничих фондів ( за інших рівних умов ).
Згладжені ( теоретичні ) значення ( із заокругленням до десятих ) наведено в останній графі табл. 1. Якщо параметри рівняння визначено правильно, то
Y = YХ = 47,2.
Побудуємо графік, який покаже згладжування емпіричних даних рівняння прямої ( рис.1.).
Рис. 2. Емпіричний і згладжені рівні ряду : 1 - Y, 2 - YX =0.167+ 0.421 X, 3- Y = 4.72
Для економічної інтерпретації лінійних і нелінійних зв'язків між двома досліджуваними явищами часто використовують розраховані за рівняннями регресії коефіцієнти еластичності.
Коефіцієнт еластичності показує, на скільки процентів зміниться в середньому результативна ознака Y при зміненні факторної ознаки X на 1 %.
Відповідно до лінійної залежності коефіцієнт еластичності визначається за формулою
Підставивши в формулу різні значення X, дістанемо різні.
У наведеному прикладі коефіцієнт еластичності на першому підприємстві при X= 12: фондів випуск продукції зростає на 0,97%. На п'ятому підприємстві при X=9: 5 =0.421- = 0.95, 4
На десятому при X = 10: 10 =0.96%.
Для всіх підприємств разом коефіцієнт еластичності
X 10.8
= a1 = 0.421 - = 0.963 % .
Y 4.72
Це означає, що при збільшенні середньої вартості основних виробничих фондів на 1 % випуск продукції зростає в середньому на 0,963 %.
Якщо залежність між ознаками представити за даними, згладженими параболою другого порядку, то коефіцієнт еластичності має такий вигляд:
X
= (a1 + a2 X ) .
Y
Визначення щільності зв'язку в кореляційно-регресійному аналізі грунтується на правилі додавання дисперсій, як і в методі аналітичного групування. Але на відміну від нього, де для оцінки лінії регресії застосовують групові середні результативної ознаки, в кореляційно-регресійному аналізі для цієї мети використовують теоретичні значення результативної ознаки.
Зобразити і обгрунтувати кореляційно-регресійний аналіз можна на прикладі графіка на рис.1. На ньому є три лінії Y - ламана лінія фактичних даних(1),YX - пряма похила лінія 2 теоретичних значень Y при абстрагуванні від впливу всіх факторів, крім фактора X(змінна середня) ,Y - пряма горизонтальна лінія 3, із середнього значення якої виключено вплив на Y всіх без винятку факторів ( стала середня ).
Розбіг лінії змінної середньої YХ З лінією сталої середньої Y пояснюється впливом факторної ознаки Х, що, в свою чергу, свідчить про існування між ознаками Y і X неповного не функціонального зв'язку. Для визначення щільності цього зв'язку потрібно обчислити дисперсію відхилень Y і YХ , тобто залишкову дисперсію, яка зумовлена впливом усіх факторів, крім Х. Різниця між загальною і залишковою дисперсіями дає теоретичну ( факторну ) дисперсію, яка вимірює варіацію, зумовлену фактором Х. На зіставленні цієї різниці із загальною дисперсією побудовано індекс кореляції, або теоретичне кореляційне відношення:
2 Заг - 2 Е 2 Е 2 У
R = = 1 - , або R =
2 Заг Заг 2 Заг
Де 2 Заг - загальна дисперсія, 2 Е - залишкова дисперсія, 2 У - факторна (теоретична) дисперсія.
Факторну дисперсію обчислюють з теоретичних значень за формулою:
( YX - Y ) 2
2Y = n
Або за формулою без теоретичних значень:
- ( a 0 Y + a 1 XY ) - (Y) 2 2Y = .
N ( Y - Y X )
Залишку дисперсію визначають або за формулою 2 Е = n, або за правилом додавання дисперсій 2 Е = 2 Заг - 2 Y .
У наведеному прикладі ( за даними розрахунків у табл..1 ) факторна дисперсія
- ( 0.167 - 47.2 + 0.421 - 539.1 ) - 4.72 2 2 Y = = 1.206.
Загальну дисперсію обчислимо за формулою
2 Заг = Y2 - ( Y )2 = 23.974 - 22.278 = 1.696.
Залишкову дисперсію визначаємо як різницю між загальною і факторною дисперсіями :
2 Е = 2 Заг - 2Y = 1.696 -1.206 = 0.409
Отже, знаходимо індекс кореляції за наведеними вище формулами :
2 Заг - 2 Е 1.696 - 0.490
R = = = 0.843.
2 Заг 1.696
Або 2 Е 0.490
R = 1 - = 1 - = 0.843
- 2 Заг 1.696 2 Y 1.206
Або
R = = = 0.711 = 0.843 2 Заг 1.696
Індекс кореляції вказує на щільну залежність випуску продукції від вартості основних виробничих фондів.
Коефіцієнт детермінації ( R 2 ) характеризує ту частину варіації результативної ознаки Y, яка відповідає лінійному рівнянню регресії:
2Y 1.206
R2 = = = 0.711
2 Заг 1.696
Отже, в обстеженій сукупності заводів 71.1% варіації випуску продукції пояснюється різними рівнями оснащеності заводів основними виробничими фондами.
Індекс кореляції набирає значень від 0 до 1. Коли R=0, то зв'язку між варіацією ознак Y i X немає. Залишкова дисперсія дорівнює загальній, 2 Е = 2 Заг , а теоретична дисперсія дорівнює нулю, 2 Заг= 0, Всі теоретичні значення YX збігаються із середніми значеннями Y, лінія YX На графіку збігається з лінією Y, тобто набуває горизонтального положення.
При R=1 теоретична дисперсія дорівнює загальний, 2 Y = 2 Заг , а залишкова 2 Е = 0.
Фактичні значення Y збігається з теоретичними YX, Зв'язок між досліджуваними ознаками лінійно-функціональний.
Індекс кореляції оцінює щільність зв'язку. Він, як і емпіричне кореляційне відношення, вимірює лише щільність зв'язку і не вказує на її напрямок.
Аби доповнити дослідження визначенням напрямку зв'язку в разі лінійної залежності використовують лінійний коефіцієнт кореляції.
XY - X Y
R = X У
Значення r коливається в межах від - 1 до +1. Додатне значення відповідає прямому зв'язку між ознаками, а від'ємне - зворотному. Оцінюють щільність зв'язку за схемою ( табл. 1 )
Таблиця 2
Зв'язок |
Лінійний коефіцієнт кореляції | |
Прямий зв'язок |
Зворотний зв'язок | |
Слабкий Середній Щільний |
|
|
Всі дані для обчислення лінійного коефіцієнта кореляції в наведеному прикладі є в табл.1.
X= Х2 - (Х)2 = 123.6 - 10.82 = 6.96 = 2.638
Y= Y2 - (Y)2 = 23.974 - 4.722 = 1.302
XY - X Y 53.91 - 10.8 - 4.72 2.9340
R = 0.854
X У 2.638 - 1.302 3.4349
Скористуємося для знаходження лінійного коефіцієнта кореляції іншою формулою:
X 2.638
R = а1 = 0.421 - = 0.853,
У 1.302
Тобто відповідь вийшла ідентичною. Це означає, що зв'язок між вартістю основних виробничих фондів і випуском продукції сильний (щільний) і прямий.
Абсолютне значення лінійного коефіцієнта кореляції збігається з індексом кореляції ( відхилення становить 0.01 ).
З наведених формул коефіцієнта кореляції можна визначити коефіцієнт регресії, не розраховуючи рівняння зв'язку:
XY - X Y 2.934
A1 = = = 0.421
2X 6.960
Або Y 1.302
А1 = r = 0.853 - = 0.421.
X 2.638
Перевірку сили зв'язку в кореляційно-регресійному аналізі здійснюють за допомогою тих самих критеріїв і процедур, що й у аналітичному групуванні. Ступені вільності залежать від числа параметрів рівняння регресії k1 = m -1 і кількості одиниць досліджуваної сукупності
K2 = n - m.
Істотність зв'язку коефіцієнта детермінації R2 Перевіряють за допомогою таблиці критерію F для 5 % - го рівня значущості. Так, при k1 = m -1= 2 - 1 = 1 ( для лінійної моделі) і k2 = n - m = 10 - 2 = 8.
Фактичне значення F-критерію у наведеному вище прикладі визначають за формулою
R2 K2 0.711 8
F Ф = = - = 19.68.
1 - R2 K1 1 - 0.711 1
Критичне значення FТ ( 0.95 ) = 5.32 набагато менше від фактичного FТ (0.95) FФ ( 5.32 19.68) , що підтверджує істотність кореляційного зв'язку між досліджуваними ознаками.
Для встановлення достовірності обчисленого нами лінійного коефіцієнта кореляції використовують критерій Стьюдента ( t - критерій ):
Де R - середня похибка коефіцієнта кореляції, яку визначають за формулою :
1 - r2
R = n - 1
При достатньо великому числі спостережень ( n > 50) коефіцієнт кореляції можна вважати достовірним, якщо він перевищує свою похибку в три і більше разів, а якщо він менший ніж три, то зв'язок між досліджуваними ознаками X i Y не доведено.
У наведеному прикладі середня похибка коефіцієнта кореляції
1 - r2 1 - 0.853 2 1 - 0.723 0.277
R = 0.092
n - 1 9 3 3
Відношення коефіцієнта кореляції до його середньої похибки 0.853
TR = 9.27
0.092
Це дає підставу вважати, що обчислений лінійний коефіцієнт кореляції достатньо точно характеризує щільність зв'язку між досліджуваними ознаками.
Похожие статьи
-
Кореляційно-регресивний аналіз - це класичний метод стохастичного моделювання господарської діяльності. Він вивчає взаємозв'язки показників господарської...
-
, I=1,2,3,...,n, Де P J ? 1 - ваговий коефіцієнт J -го вихідного показника. Розташовуючи значення показника ПJ В порядку зростання, можна визначити...
-
Якщо відома факторна модель узагальнюючого економічного показника, то наступним етапом аналізу являється виявлення величини абсолютної і відносної зміни...
-
Дослідження взаємного розподілу значень економічних показників і знаходження співвідношень функціонування виробничих систем представляє наступний...
-
ВСТУП - Кількісні методи аналізу та їх використання для прийняття управлінських рішень
Кількісні, техніко-економічні економіко-математичні, методи особливо збагатили арсенал прийомів економічного аналізу господарської діяльності. Їх широке...
-
Дана група методів є однією з найбільш поширених в системі прогнозування економічних явищ, зокрема і перспективного попиту на продукцію вугільної...
-
Існує досить багато різноманітних методик оцінки фінансового планування підприємства. Найчастіше застосовуються методики на основі фінансових...
-
Даний метод дає можливість прогнозувати попит на основі статистичної моделі, яка характеризує залежність між об'єктом (обсягом збуту) та незалежними...
-
Грошовий потік Витрати в перший рік служби системи розраховуються як сума капітальних і експлуатаційних витрат. Грошовий потік розраховується як різниця...
-
У системі управління реальними інвестиціями оцінка ефективності інвестиційних проектів є одним з найбільш відповідальних етапів. Від того, наскільки...
-
Ще однією можливістю підвищення зрізу фотоіонізації атома є збудження на останній стадії в автоіонізаційний стан. Автоіонізаційний стан (АС)- це стани...
-
В даний час існує ряд критеріїв для оцінки піно-утворення: 1. Властивості одинарної плівки. Ще Плато встановлено, що час життя плівки обернено...
-
Математичні методи ціноутворення в околі цінових знижок
МАТЕМАТИЧНІ МЕТОДИ ЦІНОУТВОРЕННЯ В ОКОЛІ ЦІНОВИХ ЗНИЖОК Авторами досліджено, що ефективність рекламних звернень підприємства проявляється як ефект...
-
Застосування парної лінійної регресії в економічних дослідженнях Зв'язок між різними явищами в економіці складний і різноманітний. На рівень розвитку...
-
Методи наближеного обчислення - Визначений інтеграл
Для деяких неперервних надінтегральних функцій F (х) первісну не можна виразити елементарними функціями. У цих випадках обчислення визначного інтеграла...
-
Модуль ARIS ABS реалізує аналіз вартості процесів, при якому структура витрат повністю прозора, на відміну від методу встановлених нормативами...
-
ДОДАТКИ - АСУ підприємства підсистема фінансового аналізу ТОВ "Цегельний завод ім. М. Г. Миндру"
ДОДАТОК А Математична модель Показник Позначення Од. виміру Формула Інвестований капітал XI Грн. XW +XL XR +XI Позиковий капітал XL Грн. Власний капітал...
-
Методика аналізу товарних запасів на підприємстві - Структура витрат в управлінні запасами
C1 - витрати по зберіганню; C2 - витрати по доставці; R - обсяг попиту (товарообороту). Для визначення оптимальної частоти завозу (tопт) необхідні...
-
Основу ІС становить інформаційна база (ІБ), що являє собою сукупність упорядкованої інформації, використовуваної при функціонуванні ІС [17,c.93]....
-
Оцінка на момент закінчення терміну дії опціону Припустимо, що нас цікавить вартість опціону "код" (далі просто "опціон") на момент закінчення його дії....
-
Метою виконання контрольного прикладу є перевірка коректності побудованої моделі аналізу фінансового стану підприємства та перевірка правильності її...
-
Вхідними даними є бухгалтерська звітність, також може використовуватись і додаткова інформація переважно оперативного характеру, однак вона має лише...
-
Розглядаючи моделі для аналізу фінансового стану можна зробити висновок, що вони дуже подібні між собою, але їхнім недоліком є те, що вони розраховують...
-
Розвиток будь-якого підприємства потребує визначення його реального планування та ефективності його фінансово-господарської діяльності, у зв'язку з чим...
-
При такому способі збуджений атом іонізується допоміжним лазерним випромінюванням або випромінюванням, що використовується в на одному з ступінів...
-
Головною метою створення Товариства є отримання прибутку шляхом виконання робіт та надання послуг підприємствам, організаціям та громадянам, як в...
-
Побудова та аналіз простої лінійної економетричної моделі
Мета - закріплення теоретичного матеріалу та здобуття практичних навичок побудови та аналізу однофакторної економетричної моделі й перевірки її...
-
ВИСНОВКИ - АСУ підприємства підсистема фінансового аналізу ТОВ "Цегельний завод ім. М. Г. Миндру"
Фінансовий стан - найважливіша характеристика економічної діяльності підприємства. Він відображає конкурентоспроможність підприємства, його потенціал в...
-
Застосування парної лінійної регресії до прогнозування економічних показників Прогноз - це ймовірностне, науково обгрунтоване судження щодо перспектив,...
-
Загальна характеристика ТОВ "Цегельний завод ім. М. Г Миндру" Загальні положення Товариство з обмеженою відповідальністю "Цегельний завод ім. М. Г...
-
Загальна характеристика прийнятого методу оцінки проектних рішень і його основних показників Головною метою розрахунку показників економічної...
-
Технічне забезпечення являє собою комплекс технічних засобів, що застосовуються для функціонування інформаційної системи, і містять у собі пристрої, за...
-
При організації раціонального варіанта внутрішньо-машинної інформаційної бази даних, яка найбільш повно відбиває специфіку об'єкта управління, перед...
-
Проектуванню форм вхідної інформації приділяється особлива увага. На цьому етапі можна скоротити обсяги даних, трудові витрати на збирання, реєстрацію,...
-
Методи визначення кальцію, Методи розділення - Питні мінеральні води
Для визначення кальцію часто доводиться попередньо видаляти всі елементи, крім лужних і лужноземельних. Методи розділення Електроліз із ртутним катодом....
-
Загальна характеристика інформаційного забезпечення Інформаційне забезпечення будь-якої системи являє собою методи класифікації та кодування інформації,...
-
Програмне забезпечення - сукупність програмних засобів для створення та експлуатації ІС засобами обчислювальної техніки. До складу програмного...
-
Перевірка отриманих результатів вимірювання на наявність грубих похибок за Q - критерієм при ? = 0,95 Де: Хі - отримані результати аналізу Перевірка...
-
Математичний алгоритм рішення задач представлений математичним описом, який включає математичну модель і математичні формули розрахунку основних...
-
BONAQUA МОРШИНСЬКА ЗНАМЕНІВСЬКА МИРГОРОДСЬКА Статистична обробка результатів аналізу Перевірка отриманих результатів вимірювання загальної лужності...
Кореляційний і регресивний методи аналізу зв'язку