Кореляційний аналіз (Олена Керенцева)

12
Підготувала: Керенцева О. Ю. Тема доповіді: Кореляційний аналіз експериментальних даних. Кореляційна матриця. Перевірка гіпотез відносно значень кореляційної матриці. Тернопіль, 2010

Upload: oleg-nazarevych-taltekinfo

Post on 24-Jun-2015

736 views

Category:

Documents


9 download

DESCRIPTION

Кореляційний аналіз. Кореляційна матриця (Олена Керенцева, СНм-51), 2010{for - taltek.info}

TRANSCRIPT

Page 1: Кореляційний аналіз (Олена Керенцева)

Підготувала: Керенцева О. Ю.

Тема доповіді: Кореляційний аналіз експериментальних даних. Кореляційна матриця. Перевірка гіпотез відносно значень кореляційної матриці.

Тернопіль, 2010

Page 2: Кореляційний аналіз (Олена Керенцева)

Поняття кореляційного аналізу

• Кореляційний аналіз – один з математично-статистичних методів обробки експериментальних даних, отриманих у ході проведення експерименту.

• Кореляційний аналіз – це статистичне дослідження (стохастичної) залежності між випадковими величинами (англ. correlation – взаємозв’язок). У найпростішому випадку досліджують дві вибірки (набори даних), у загальному – багатовимірні комплекси (групи) параметрів або об’єктів.

• Кореляційний аналіз з’ясовує наявність статистичною зв’язку між змінними, що досліджуються

2

Page 3: Кореляційний аналіз (Олена Керенцева)

Історія розвитку кореляційної теорії

• Термін "кореляція " вперше застосував французький палеонтолог Ж. Кюв'є, який вивів "закон кореляції частин та органів тварин" (цей закон дозволяє відновлювати по знайденим частинам тіла вигляд усього тварини).

• У статистику зазначений термін ввів у 1886 році англійський біолог і статистик Френсіс Гальтон (не просто зв'язок - relation, а "як би зв'язок " - co-relation).

• Точну формулу для підрахунку коефіцієнта кореляції розробив його учень - математик і біолог - Карл Пірсон (1857 - 1936).

• В 1904 р. Ч. Спірмен вивів формулу для критерію рангової кореляції.

• В 1934 р. була надрукована робота А. Я. Хінчіна "Теорія кореляції стаціонарних стохастичних процесів ", яку слід вважати початком побудови загальної теорії випадкових процесів, він же разом із Коломогоровим вивів формулу для автокореляції.

• В 1938 р. британський статистик Дж. Кендалл ввів поняття коефіцієнта кореляції Кендалла.

3

Page 4: Кореляційний аналіз (Олена Керенцева)

4

Коефіцієнт кореляції

Коефіцієнт кореляції, а в загальному випадку кореляційна функція, дозволяють встановити степінь взаємозв’язку між змінними. Кореляція може бути лінійною або нелінійною в залежності від тип залежності, яка фактично існує між змінними. Досить часто на практиці розглядають тільки лінійну кореляцію (взаємозв’язок).

Формула для обчислення коефіцієнтів кореляції має вигляд

де N− довжина вибірки даних; x, y− середні вибіркові x, y; σx,σy − стандартні відхилення, тобто корені квадратні з їх дисперсій.

Page 5: Кореляційний аналіз (Олена Керенцева)

5

Кореляційна матриця

Використовуючи коефіцієнти кореляції можна поставити у відповідність експерементальним даним квадратну матрицю коефіцієнтів кореляції R:

Характерні властивості кореляційної матриці : - симетричність щодо головної діагоналі, rjk =

rkj,; - одиничні значення елементів головної діагоналі, rkk = 1

Page 6: Кореляційний аналіз (Олена Керенцева)

Перевірка гіпотез відносно значень кореляційної матриці

6

Потрібно оцінити значимість вибіркової величини коефіцієнта або, відповідно до постановкою завдань перевірки статистичних гіпотез, перевірити гіпотезу про рівність нулю коефіцієнта кореляції.

•Якщо гіпотеза Н0 про рівність нулю коефіцієнта кореляції буде відкинута, то вибірковий коефіцієнт значущий, а відповідні величини пов'язані лінійним співвідношенням.

•Якщо гіпотеза Н0 буде прийнята, то оцінка коефіцієнта не значима, і величини лінійно не пов'язані один з одним.

•Конкуруюча гіпотеза Н1 відповідає твердженням, що значення rik не дорівнює нулю (більше або менше нуля).

Перевірка гіпотези про значущість оцінки коефіцієнта кореляції вимагає знання розподілу цієї випадкової величини. Розподіл величини rik вивчено тільки для окремого випадку, коли випадкові величини Uj і Uk розподілені за нормальним законом.

В якості критерію перевірки нульової гіпотези Н0 застосовують випадкову величину

Page 7: Кореляційний аналіз (Олена Керенцева)

7

Приклад задачі лінійного кореляційного аналізу

Постановка задачі лінійного кореляційного аналізу формулюється в наступному вигляді. Є матриця спостережень (характеристики каналу).

Необхідно визначити оцінки коефіцієнтів кореляції для всіх чи тільки для заданих пар параметрів і оцінити їх значимість. Незначущі оцінки прирівнюються до нуля. Визначити наявність лінійних кореляційних зв'язків між пропускною здатністю та іншими факторами. Перевірку гіпотези про значимість оцінок коефіцієнтів кореляції провести з рівнем значущості a, рівним 0,1.

Page 8: Кореляційний аналіз (Олена Керенцева)

8

Розв’язокЗавдання аналізу вирішується в кілька етапів:• проводиться стандартизація вихідної матриці;• обчислюються парні оцінки коефіцієнтів кореляції;• перевіряється значущість оцінок коефіцієнтів кореляції, незначущі оцінки

прирівнюються до нуля. • За результатами перевірки робиться висновок про наявність зв'язків між

варіантами (факторами).

Стандартизація вихідної матриці починається з обчислення середнього арифметичного m1, незміщеної оцінки дисперсії m2 і середньоквадратичного відхилення s по кожній варіанті.

Page 9: Кореляційний аналіз (Олена Керенцева)

9

Розв’язокУ результаті переходу до величин uij = (xij-m1)/s формується

стандартизована матриця вихідних даних.

Page 10: Кореляційний аналіз (Олена Керенцева)

Розв’язок

Оцінки коефіцієнтів кореляції представлені у наступній таблиці. У цій же таблиці наведені значення статистик критерію Стьюдента для обчислених оцінок коефіцієнтів кореляції при n = 15.

Критичне значення tкр (n-2; a) = tкр (13; 0,1) = 1,77. Статистика критерію більше критичного значення тільки для r12. Це означає, що лише для зазначеного коефіцієнта оцінка значима (коефіцієнт кореляції генеральної сукупності не дорівнює нулю), а інші коефіцієнти слід визнати рівними нулю.

10

Page 11: Кореляційний аналіз (Олена Керенцева)

Висновки

• Кореляція використовується як один з основних показників взаємозв’язку між випадковими змінними.

• Коефіцієнти кореляції відносно прості в підрахунку, їх застосування не вимагає спеціальної математичної підготовки. У поєднанні з простотою інтерпретації, простота застосування коефіцієнта веде до його широкого розповсюдження у сфері аналізу статистичних даних.

• Кореляційна матриця дає змогу прослідкувати статистично значимі зв’язки між змінними.

11

Page 12: Кореляційний аналіз (Олена Керенцева)

12

Використані літературні джерела

1.http://dvo.sut.ru/libr/opds/i130hod2/index.htm - Обработка експерементальных даных на ЭВМ.

2.http://www.statsoft.ru/home/portal/dataan/correlations/correlations1.htm - Теоретические основы анализа даных.

3. http://matstats.ru/matrix.html - Корреляционные матрицы и графы.