вторник, 27 ноября 2018 г.

На что обратить внимание при решении практических задач? (Линейная регрессия)

В предыдущих статьях были рассмотрены основные этапы использования метода регрессионной обработки данных, а именно: как сделать статистические выводы относительно параметров регрессии, как оценить математическое ожидание отклика и предсказать величину отклика при выбранном значении регрессора. 

Сделаем несколько общих предостережений относительно адекватной интерпретации результатов регрессионной обработки данных и их соответствия решаемым практическим задачам.
  1. Регрессионный анализ часто используют для того, чтобы сделать те или иные выводы, относящиеся к будущему временному периоду. Например, планируя штат преподавателей руководство университета может быть заинтересовано в прогнозе числа абитуриентов, полученного с помощью регрессионной модели, содержащей несколько демографических переменных в качестве регрессоров. В таких задачах важно помнить, что корректность выводов зависит от неизменности влияющих на модель факторов в будущем по сравнению с их состоянием на момент создания регрессионной модели.
  2. Предсказывая новое значение отклика \(y\) следует учитывать, что предиктор \(x\) сам по себе может являться результатом прогноза. Например, прогноз выручки компании на следующий год на основании данных о числе покупателей старше \(16\) лет является условным прогнозом, так как зависит от точности проекции на год вперед соответствующего демографического показателя о возрасте. 
  3. Требуется осторожность в прогнозе отклика для значения \(x_i\) независимой переменной далеко отстоящего от границ интервала, содержащего учтенные в модели наблюдения переменной \(x\).
  4. Статистический тест, позволяющий заключить, что \(\beta_1\neq0\) не устанавливает причинно-следственную связь между предиктором и откликом. Как уже было отмечено, обе переменные \(x\) и \(y\) могут одновременно быть подвержены влиянию некоторой третьей переменной, которая не включена в регрессионную модель. Вместе с тем, существование значимой регрессионной зависимости, полученной при контролируемом эксперименте часто свидетельствует в пользу такой причинно-следственной связи.
  5. Часто требуется получить оценки для нескольких математических ожиданий отклика или предсказать несколько новых наблюдений при различных уровнях регрессора. В этом случае, при множественном статистическом выводе, появляются специфические проблемы. Эти нюансы не позволяют использовать рассмотренные доверительные интервалы для математического ожидания отклика и нового отклика, которые получены для случая единственного значения \(x_i\).
  6. В заключении отметим, что в случае, когда регрессор \(x\) имеет ошибку измерения полученные оценки параметров регрессии становятся смещенными и требуется предпринять дополнительные меры для контроля результатов в данной ситуации.

Комментариев нет:

Отправить комментарий