1 / 49

BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY

BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY. CHƯƠNG 5. BIẾN GIẢ. 1. Biết cách đặt biến giả 2. Nắm phương pháp sử dụng biến giả trong phân tích hồi quy. MỤC TIÊU. NỘI DUNG. Khái niệm biến giả. 1. Sử dụng biến giả trong mô hình hồi quy. 2. 3. Kỹ thuật sử dụng biến giả. 5.1 KHÁI NIỆM.

micah
Download Presentation

BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY CHƯƠNG 5

  2. BIẾN GIẢ 1. Biếtcáchđặtbiếngiả 2. Nắmphươngphápsửdụngbiếngiảtrongphântíchhồiquy MỤC TIÊU

  3. NỘI DUNG Khái niệm biến giả 1 Sử dụng biến giả trong mô hình hồi quy 2 3 Kỹ thuật sử dụng biến giả

  4. 5.1 KHÁI NIỆM • Biến định lượng: các giá trị quan sát được thể hệ bằng con số • Biến định tính: thể hiện một số tính chất nào đó • Để đưa những thuộc tính của biến định tính vào mô hình hồi quy, cần lượng hóa chúng => sử dụng biến giả (dummy variables)

  5. Chi tiêucủahộ = α + β1* quymôhộ + β2*trìnhđộvănhóacủachủhộ+ β3* tuổicủachủhộ + β4* giớitínhcủachủhộ β5* nơisinhsốngcủahộ

  6. Ví dụ • Cóhaibiếnđộclậpđịnhtínhlàgiớitínhcủachủhộvànơisinhsốngcủahộ. Đểphântíchhồiquycầnphảilượnghóahaibiếnđịnhtínhnày. • Thựchiện: Giớitínhgồmhaibiểuhiệnlànamvànữvàmãhóanhưsau: Nam=1, Nữ=0. • Nơisinhsốngcủahộgồmthànhthịvànôngthônnênmãhóanhưsau: Thànhthị=1, Nôngthôn=0. (Việcchọnsốmãhóatùynhàphântích).

  7. Dữ liệu đã mã hóa

  8. Ví dụ

  9. Ví dụ • Nghề nghiệp có 3 nghề (3 phạm trù) • Chọn 1 nghề làm phạm trù cơ sở Ví dụ: chọn bác sĩ 3. Hai nghề còn lại là hai biến mới Vậy số biến mới = số phạm trù -1 4. Biến Giáo viên nhận 2 giá trị: 1 nếu là giáo viên; 0 nếu không phải là giáo viên 5. Biến Nông dân nhận 2 giá trị: 1 nếu là nông dân; 0 nếu không phải là nông dân

  10. Câu hỏi • Nếu có thêm nghề kế toán thì sao?

  11. HỒI QUY VỚI BiẾN ĐỊNH TÍNH Quytắc: Nếubiếnđịnhtínhcó m biểuhiệnthìsửdụng m-1 biến. Vídụ: Tổng chi tiêucủahộphụthuộcvào • Giớitínhcủachủhộ • Sốthànhviêntronghộ • Vùngnơihộsinhsống (có 8 vùng) Biếnđịnhtínhlàbiếnnào?

  12. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy Ví dụ 5.1: Xét mô hình Yi = 1 + 2Xi + 3Di + Ui với Y Tiền lương (triệu đồng/tháng) X Bậc thợ D=1 nếu công nhân làm trong khu vực tư nhân D=0 nếu công nhân làm trong khu vực nhà nước D được gọi là biến giả trong mô hình

  13. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy

  14. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy E(Y/X,D) = 1 + 2Xi + 3Di (5.1) E(Y/X,D=0) = 1 + 2Xi (5.2) E(Y/X,D=1) = 1 + 2Xi + 3 (5.3) (5.2): tiền lương trung bình của công nhân làm việc trong khu vực quốc doanh với bậc thợ là X (5.3): tiền lương trung bình của công nhân làm việc trong khu vực tư nhân với bậc thợ là X

  15. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy 2tốc độ tăng lương theo bậc thợ 3chênh lệch tiền lương trung bình của công nhân làm việc ở hai khu vực và cùng bậc thợ (Giả thiết của mô hình: tốc độ tăng lương theo bậc thợ ở hai khu vực giống nhau)

  16. Y X Hình 5.1 mức thu nhập bình quân tháng của người lao động tại KVQD và KVTN khi có bậc thợ là X E(Y/X,Z) = 1 + 2Xi + 3Di

  17. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy • Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào thời gian công tác (X) (năm) và nơi làm việc của người lao động (DNNN, DNTN và DNLD) • Dùng 2 biến giả Z1 và Z2 với • Z1i =1nơi làm việc tại DNNN • Z1i =0nơi làm việc tại nơi khác • Z2i =1nơi làm việc tại DNTN • Z2i =0nơi làm việc tại nơi khác • Z1i = 0 và Z2i = 0 phạm trù cơ sở

  18. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy

  19. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy • E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i • E(Y/X,Z1=0,Z2=0) = 1 + 2Xi • E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3 • E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4 • 3 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNNN và DNLD khi có cùng thời gian làm việc X năm • 4 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNTN và DNLD khi có cùng thời gian làm việc X năm

  20. 1: nếu trình độ từ đại học trở lên D1i = 0: trường hợp khác 1: nếu trình độ cao đẳng D2i = 0: trường hợp khác 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy Ví dụ 5.3. thu nhập còn phụ thuộc vào trình độ người lao động (từ đại học trở lên, cao đẳng và khác) Một chỉ tiêu chất lượng có n phạm trù (thuộc tính) khác nhau thì dùng n-1 biến giả

  21. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy Giả sử Y, X là biến định lượng, Z là biến giả (định tính) • TH1: Y= 1 + 2Z + 3X + U • TH2: Y= 1 + 2X + 3(ZX) + U • TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U

  22. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy • VD 5.4: Khảosátlươngcủanhânviêntheosốnămkinhnghiệmvàgiớitính • TH1: Y= 1 + 2Z + 3X + U • TH2: Y= 1 + 2X + 3(ZX) + U • TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U • Trongđó • Y lương • X sốnămkinhnghiệm • Z giớitínhvới Z=1: nam; Z=0: nữ

  23. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy • TH1: Lươngkhởiđiểmcủanvnamvànữkhácnhaunhưngtốcđộtănglươngtheosốnămkinhnghiệmnhưnhau • TH2: Lươngkhởiđiểmnhưnhaunhưngtốcđộtănglươngkhácnhau • TH3: Lươngkhởiđiểmvàtốcđộtănglươngkhácnhau

  24. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy TH1: Lươngkhởiđiểmcủanvnamvànữkhácnhaunhưngtốcđộtănglươngtheosốnămkinhnghiệmnhưnhau Hàm PRF: Y= 1 + 2Z + 3X + U Hàm SRF ứngvớinữ (Z=0) : Hàm SRF ứngvớinam (Z=1) :

  25. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy Hình 5.2 Lương khởi điểm của nv nam và nữ khác nhau

  26. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy TH2: Lươngkhởiđiểmnhưnhaunhưngtốcđộtănglươngkhácnhau Hàm PRF: Y= 1 + 2X + 3(ZX) + U Với ZX gọilàbiếntươngtác Hàm SRF ứngvớinữ (Z=0) : Hàm SRF ứngvớinam (Z=1) :

  27. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy Hình 5.3 Mức tăng lương theo số năm kinh nghiệm của nv nam và nữ khác nhau

  28. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy TH3: Lươngkhởiđiểmvàtốcđộtănglươngkhácnhau Hàm PRF: Y= 1 + 2Z + 3X + 4(ZX)+ U Hàm SRF ứngvớinữ (Z=0) : Hàm SRF ứngvớinam (Z=1) :

  29. 5.2 Sửdụngbiếngiảtrongmôhìnhhồiquy Hình 5.4 Lương khởi điểm và mức tăng lương của nv nam và nữ khác nhau

  30. 5.3 Ứngdụngsửdụngbiếngiả 5.3.1 Sử dụng biến giả trong phân tích mùa Y chi tiêu cho tiêu dùng X thu nhập Z = 1 nếu quan sát trong mùa (tháng 1-6) Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12) TH1: Nếuyếutốmùachỉảnhhưởngđếnhệsốchặn TH2: Nếuyếutốmùacóảnhhưởngđếnhệsốgóc Môhình * cótínhtổngquáthơn. Qua việckiểmđịnhgiảthiếtđểbiếtđượchệsốgócnàocó ý nghĩa.

  31. Vídụ Có bảng số liệu sau về doanh số bán từng quý (triệu đồng). Hãy sắp xếp lại số liệu, sử dụng biến giả và viết mô hình hồi quy.

  32. Vídụ

  33. Viếtmôhìnhhồiquymẫuvà ý nghĩacáchệsố

  34. 5.3 Ứngdụngsửdụngbiếngiả 5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy Ví dụ 5.5. Số liệu tiết kiệm (Y) và thu nhập cá nhân (X) ở nước Anh từ 1946-63 (triệu pounds)

  35. 5.3 Ứngdụngsửdụngbiếngiả Mục tiêu: Kiểm tra hàm tiết kiệm có thay đổi cấu trúc giữa 2 thời kỳ hay không. Cách 1 Lập hai mô hình tiết kiệm ở 2 thời kỳ Thời kỳ tái thiết: 1946-54 (5.3.1) Thời kỳ hậu tái thiết: 1955-63 (5.3.2) Và kiểm định các trường hợp sau

  36. Kiểmđịnh Chow Giảthiết: H0: Haihàm (5.3.1) và (5.3.2) giốngnhau B1: Gộphainhómquansát n=n1+n2 vàtính RSS cóbậctự do df= n1+n2-k từmôhìnhhồiquy B2: Ướclượng (5.3.1) và (5.3.2) vàthuđược RSS1 códf = n1-k, RSS2 códf = n2-k. Đặt RSS*=RSS1+RSS2 B3: Tính B4: Nếu F > Fα(k, n1+n2-2k): bácbỏ H0

  37. 5.3 Ứngdụngsửdụngbiếngiả Cách 2Sửdụngbiếngiả B1. Lậphàmtiếtkiệmtổngquátcủacả 2 thờikỳ Với n = n1 + n2 Z = 1 quansátthuộcthờikỳtáithiết Z = 0 quansátthuộcthờikỳhậutáithiết B2. Kiểmđịnhgiảthiết H0: 3=0 Nếuchấpnhận H0: loạibỏ Z rakhỏimôhình B3. Kiểmđịnhgiảthiết H0: 4=0 Nếuchấpnhận H0: loạibỏZiXirakhỏimôhình

  38. 5.3 Ứngdụngsửdụngbiếngiả Kết quả hồi quy theo mô hình như sau t = (-5,27) (9,238) (3,155) (-3,109) p = (0,000) (0,000) (0,007) (0,008) • Nhậnxét • Tung độgốcchênhlệchvàhệsốgócchênhlệchcó ý nghĩathốngkê • Cáchồiquytronghaithờikỳlàkhácnhau

  39. 5.3 Ứngdụngsửdụngbiếngiả Thời kỳ tái thiết: Z = 1 Thời kỳ hậu tái thiết: Z = 0

  40. Tiết kiệm Thu nhập 5.3 Ứngdụngsửdụngbiếngiả Thời kỳ hậu tái thiết Thời kỳ tái thiết -0.27 -1.75 Hình 5.6 Mô hình hồi quy cho 2 thời kỳ

  41. 5.3 Ứngdụngsửdụngbiếngiả 5.3.3. Hàm tuyến tính từng khúc Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng sẽ khác với khi doanh thu trên X*. Hàm hồi quy có dạng Y Tiền hoa hồng X Doanh thu X* Giá trị ngưỡng sản lượng Zi =1 nếu Xi > X* Zi =0 nếu Xi ≤ X*

  42. Y X 5.3 Ứngdụngsửdụngbiếngiả Hình 5.7 Hàm tuyến tính từng khúc • Kiểm định giả thiết H0: 3=0 • Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc

  43. 5.3 Ứngdụngsửdụngbiếngiả Ví dụ: Sản lượng dưới X*, thì chi phí hoa hồng sẽ khác với khi sản lượng trên X*. Hàm hồi quy sẽ có dạng: Y: Chi phí; X: sản lượng;X*=5.500 tấn: giá trị ngưỡng sản lượng

  44. 5.3 Ứngdụngsửdụngbiếngiả Ta có kết quả hồi quy như sau: t = (-0,824) (6,607) (1,145) R2 = 0,9737 X* = 5500

More Related