08 February 2009

Линейная регрессия

  • Часть 1
  • | 2
  • | 3

Моделирование данных может выполняться несколькими методами: интерполяция, регрессия, или сглаживание данных.  Интерполяция гарантирует, что аппроксимирующая кривая пройдет через каждую точку. Регрессия просто гарантирует, что "оценочная функция",  т.е. некоторая произвольная функция, которая измеряет несоответствие между данными и моделью будет минимизирована. При этом подходе, параметры модели подбираются до тех пор, пока оценочная функция не достигнет минимума.

Стандартная ошибка и коэффициент корреляции. При подборе функции регрессии, погрешность оценивается с помощью стандартной ошибки и коэффициента корреляции. Эти инструментальные средства не совершенны, но они дают полезную оценку деятельности посадки кривой. Стандартная ошибка определена следующим образом:

Image

где  f(xi)  - значения, рассчитанные по модели регрессии, yi - точки данных, и n - число параметров в конкретной модели (так, чтобы знаменатель соответствовал числу степеней свободы).  Стандартная ошибка  определяет разброс точек данных вокруг кривой регрессии. По мере улучшения качества модели  стандартная ошибка приближается к нулю. 

Другой критерий "согласия" - это коэффициент корреляции. Чтобы объяснить значение этого критерия, мы должны возвратиться точкам данных и определить допустимое отклонение, которое определяет величину разброса данных вокруг среднего:

Image

Где среднее число точек данных y  задается как

Image

Величина St рассматривает разброс вокруг постоянной линии (среднее) в отличие от разброса вокруг модели регрессии. Это - неопределенность зависимой переменной от регрессии. Мы также определяем отклонение от сглаживающей кривой как

предыдущаяследующая