понедельник, 17 сентября 2018 г.

Что такое статистическая зависимость? (Линейная регрессия)


С самого начала полезно различать функциональную зависимость между переменными и статистическую зависимость между ними.

Функциональная зависимость между двумя переменными, как правило, выражается аналитической формулой и имеет вид \(y=f(x)\). В этом случае для заданного значения \(x\) по правилу \(f\) можно точно указать соответствующее значение \(y\). Если построить соответствующий график, то все наблюдения точно попадут на кривую функциональной зависимости - это ее отличительная характеристика.

При статистической зависимости, из-за возможной ошибки в наблюдениях, значения \(y\), в общем случае, не принадлежат соответствующей кривой.

Рассмотрим данные об оценке \(10\) сотрудников в середине и в конце года (рис. 1).
Рисунок 1.
Результат оценки в конце года обозначим \(Y\) и назовем зависимой переменной или откликом, а результат оценки в середине года обозначим \(X\) и назовем независимой, объясняющей переменной или предиктором. Например, для первого служащего имеем \(X=90\), \(Y=75\).

На рисунке отчетливо просматривается положительная связь между переменными \(X\) и \(Y\) в том смысле, что с увеличением значений регрессора соответствующие значения отклика увеличиваются. Однако, из-за вариации, точки не лежат на прямой и возможен случай, когда два сотрудника с одинаковой оценкой в середине года \(X=80\) имеют отличные оценки в конце года \(Y=58\), \(Y=60\). Поэтому график, изображающий статистическую зависимость, принято называть диаграммой рассеяния.

На следующей диаграмме рассеяния (рис. 2), статистическая зависимость между переменными \(X\) и \(Y\) выбрана в форме прямой, хорошо отражающей общую тенденцию поведения данных.
Рисунок 2.
Снова отметим, что большая часть точек не лежит на указанной прямой. Таким образом, рассеивание значений переменной \(Y\) относительно прямой не обусловлено изменением переменной \(X\) и чаще всего интерпретируется как имеющее случайную природу.

Изучение статистических зависимостей может оказаться чрезвычайно полезным, несмотря на то, что они не обладаю точностью, присущей функциональным зависимостям.

Комментариев нет:

Отправить комментарий