В предыдущих статьях были рассмотрены основные этапы использования метода регрессионной обработки данных, а именно: как сделать статистические выводы относительно параметров регрессии, как оценить математическое ожидание отклика и предсказать величину отклика при выбранном значении регрессора.
Сделаем несколько общих предостережений относительно адекватной интерпретации результатов регрессионной обработки данных и их соответствия решаемым практическим задачам.
- Регрессионный анализ часто используют для того, чтобы сделать те или иные выводы, относящиеся к будущему временному периоду. Например, планируя штат преподавателей руководство университета может быть заинтересовано в прогнозе числа абитуриентов, полученного с помощью регрессионной модели, содержащей несколько демографических переменных в качестве регрессоров. В таких задачах важно помнить, что корректность выводов зависит от неизменности влияющих на модель факторов в будущем по сравнению с их состоянием на момент создания регрессионной модели.
- Предсказывая новое значение отклика \(y\) следует учитывать, что предиктор \(x\) сам по себе может являться результатом прогноза. Например, прогноз выручки компании на следующий год на основании данных о числе покупателей старше \(16\) лет является условным прогнозом, так как зависит от точности проекции на год вперед соответствующего демографического показателя о возрасте.
- Требуется осторожность в прогнозе отклика для значения \(x_i\) независимой переменной далеко отстоящего от границ интервала, содержащего учтенные в модели наблюдения переменной \(x\).
- Статистический тест, позволяющий заключить, что \(\beta_1\neq0\) не устанавливает причинно-следственную связь между предиктором и откликом. Как уже было отмечено, обе переменные \(x\) и \(y\) могут одновременно быть подвержены влиянию некоторой третьей переменной, которая не включена в регрессионную модель. Вместе с тем, существование значимой регрессионной зависимости, полученной при контролируемом эксперименте часто свидетельствует в пользу такой причинно-следственной связи.
- Часто требуется получить оценки для нескольких математических ожиданий отклика или предсказать несколько новых наблюдений при различных уровнях регрессора. В этом случае, при множественном статистическом выводе, появляются специфические проблемы. Эти нюансы не позволяют использовать рассмотренные доверительные интервалы для математического ожидания отклика и нового отклика, которые получены для случая единственного значения \(x_i\).
- В заключении отметим, что в случае, когда регрессор \(x\) имеет ошибку измерения полученные оценки параметров регрессии становятся смещенными и требуется предпринять дополнительные меры для контроля результатов в данной ситуации.
Комментариев нет:
Отправить комментарий