Асоциация срещу корелация
  

Асоциацията и корелацията са два метода за обяснение на връзка между две статистически променливи. Асоциацията се отнася до по-обобщен термин и корелацията може да се разглежда като специален случай на свързване, където връзката между променливите е линейна по своя характер.

Какво е асоциация?

Статистическата терминова асоциация се определя като връзка между две случайни променливи, което ги прави статистически зависими. Отнася се до по-скоро обща връзка, без да се споменават специфики на връзката и не е необходимо да бъде причинно-следствена връзка.

Много статистически методи се използват за установяване на връзката между две променливи. Коефициентът на корелация на Пиърсън, коефициентът на коефициент, корелацията на разстоянието, Ламбда на Гудман и Крускал и Rho (ρ) са няколко примера.

Какво е корелация?

Корелацията е мярка за силата на връзката между две променливи. Коефициентът на корелация количествено определя степента на промяна на една променлива въз основа на промяната на другата променлива. В статистиката корелацията е свързана с понятието зависимост, което е статистическата връзка между две променливи

Коефициентът на корелация на Пиърсън или просто коефициентът на корелация r е стойност между -1 и 1 (-1≤r≤ + 1). Той е най-често използваният коефициент на корелация и е валиден само за линейна връзка между променливите. Ако r = 0, не съществува връзка и ако r≥0, отношението е пряко пропорционално; стойността на една променлива се увеличава с увеличаването на другата. Ако r≤0, връзката е обратно пропорционална; една променлива намалява с увеличаване на другата.

Поради условието за линейност, коефициентът на корелация r може да се използва и за установяване наличието на линейна връзка между променливите.

Коефициентът на корелация на Spearman и коефициентът на корелация на Kendrall измерват силата на връзката, с изключение на линейния коефициент. Те отчитат степента, в която една променлива се увеличава или намалява с другата. Ако и двете променливи се увеличат заедно, коефициентът ще бъде положителен и ако една променлива се увеличава, докато другата намалява, стойността на коефициента ще бъде отрицателна.

Коефициентите за корелация на ранг се използват само за установяване на типа на връзката, но не и за подробно изследване като коефициента на корелация на Пиърсън. Те се използват и за намаляване на изчисленията и за по-независими резултатите от разглежданите разпределения.

Каква е разликата между асоциацията и корелацията?

• Асоциацията се отнася до общата връзка между две случайни променливи, докато корелацията се отнася до повече или по-малко линейна връзка между случайните променливи.

• Асоциацията е понятие, но корелацията е мярка за свързване и се предоставят математически инструменти за измерване на големината на корелацията.

• Коефициентът на корелация на момента на продукта на Pearson установява наличието на линейна връзка и определя естеството на връзката (независимо дали те са пропорционални или обратно пропорционални).

• Коефициентите на корелация на ранга се използват само за определяне на естеството на връзката, с изключение на линейността на връзката (тя може или не може да бъде линейна, но ще покаже дали променливите се увеличават заедно, намаляват заедно или едната се увеличава, докато другата намалява или обратно).