1 / 38

Лекция 6 Линейная регрессия

Лекция 6 Линейная регрессия. Простая линейная регрессия. Простая линейная регрессия. Простая линейная регрессия. r = -0.88 достаточно тесная обратная взаимосвязь. Прогнозирование. минимально-максимальный метод линейная регрессия. Минимально-максимальный метод. низкая точность метода

Download Presentation

Лекция 6 Линейная регрессия

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Лекция 6Линейная регрессия

  2. Простая линейная регрессия

  3. Простая линейная регрессия

  4. Простая линейная регрессия • r = -0.88 • достаточно тесная обратная взаимосвязь

  5. Прогнозирование • минимально-максимальный метод • линейная регрессия

  6. Минимально-максимальный метод • низкая точность метода • Y = 27.43-0.71X

  7. Простая линейная регрессия Генеральная совокупность Выборка

  8. Простая линейная регрессия • метод наименьших квадратов(наименьшая сумма квадратов ошибок)

  9. Простая линейная регрессия

  10. Простая линейная регрессия

  11. Простая линейная регрессия Математические ожидания возможных значений У на одной прямой при изменении Х

  12. Прогнозирование с использованием линейной регрессии • Два источника неопределенности: • неопределенность, обусловленная отклонением точек данных от выборочной прямой регрессии • неопределенность, обусловленная отклонением выборочной прямой регрессии от регрессионной прямой генеральной совокупности

  13. Простая линейная регрессия: ошибки Ошибка (ε) – расстояние между значением У и его математическим ожиданием Стандартная ошибка оценки– степень отличия реальных значений Y от оценочных Стандартная ошибка прогноза- вариативность около Y для данного значения Х

  14. Простая линейная регрессия Границы интервала прогноза величины У: df = n-2 Для большой выборки - 95%-ный интервал:

  15. Простая линейная регрессия

  16. Простая линейная регрессия Предположения, положенные в основу модели линейной регрессии: • для заданного значения Х генеральная совокупность значений У имеет нормальное распределение относительно регрессионной прямой совокупности • разброс генеральной совокупности точек данных относительно регрессионной прямой совокупности остается постоянным всюду вдоль этой прямой (дисперсия генеральной совокупности не увеличивается и не уменьшается) • слагаемые ошибок εнезависимы между собой • в генеральной совокупности существует линейная зависимость между Х и У

  17. Разложение дисперсии наблюдение = прогноз + отклонение или наблюдаемое значение Y объясненное линейной зависимостью остаток или отклонение от линейной зависимости

  18. Разложение дисперсии = + n - 1 = n – 2 + 1

  19. Разложение дисперсии SST = SSR+SSE 222 = 172.023 + 49.977 SSR/SST = 0.775 77.5% объясняется взаимосвязью Х и У

  20. Разложение дисперсии Таблица ANOVA для прямолинейной регрессии

  21. Разложение дисперсии SST = SSR+SSE 222 = 172.023 + 49.977 общая вариация объясненная вариация необъясненная вариация

  22. Коэффициент детерминация b0=32.75 регрессионная прямая Yпрогноз.-Yср (объясненное посредством Х) Yср=11 Y – Yср(всего) Y.-Yпрогноз (необъясненное посредством Х)

  23. Коэффициент детерминации Выборочный коэффициент детерминации • измеряет долю изменчивости Y, которую можно объяснить с помощью информации об изменчивости (разнице значений) независимой переменной Х

  24. Коэффициент детерминации 77.5% изменчивости количества продаваемого молока можно объяснить разницей в цене за 1 л

  25. Коэффициент детерминации Для прямолинейной регрессии коэффициент детерминации равен квадрату коэффициента корреляции

  26. Коэффициент детерминации

  27. Проверка гипотез

  28. Проверка гипотез Проверочная статистика t

  29. Проверка гипотез t расч. = - 5.25 t табл. = 2.306 отклонить нулевую гипотезу

  30. Проверка гипотез Проверка нулевой гипотезы с помощью таблицы ANOVA df = 1, n-2 Область отклонения гипотезы:

  31. Проверка гипотез F расч. = 27.54 F табл. = 5.32 отклонить нулевую гипотезу

  32. Анализ остатков Предположения, сделанные для модели прямолинейной регрессии • Связь между переменными является линейной • Ошибки являются независимыми • Дисперсии ошибок равны • Значения ошибки нормально распределены

  33. Анализ остатков Проверка соответствия предполагаемой модели • Построить гистограмму значений остатков • Расположить остатки по значениям оцениваемых величин • Расположить остатки по значениям объясняющих переменных • Расположить остатки по времени их появления, если исходные данные хронологически упорядочены

  34. Прогноз объемов продаж молока

  35. Регрессия

  36. Регрессия

  37. Регрессия

  38. Регрессия

More Related