1 / 70

추정 , 검정의 기본개념 (Statistical inference)

추정 , 검정의 기본개념 (Statistical inference). 모집단과 표본. 모집단 (Population) : 연구자가 알고자 하는 관심의 대상 전체 표본 (Sample) : 전체 관심대상집단 중에서 뽑힌 부분집단. 질문 1 : 동전을 10 번 던져 앞면이 6 번 , 뒷면이 4 번 나타났다면 이 동전은 잘 만들어졌다고 할 수 있을까 ?.

kedem
Download Presentation

추정 , 검정의 기본개념 (Statistical inference)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 추정, 검정의 기본개념(Statistical inference)

  2. 모집단과 표본 모집단(Population) : 연구자가 알고자 하는 관심의 대상 전체 표본(Sample) : 전체 관심대상집단 중에서 뽑힌 부분집단

  3. 질문 1 : 동전을 10번 던져 앞면이 6번, 뒷면이 4번 나타났다면 이 동전은 잘 만들어졌다고 할 수 있을까? 질문 2 : 총 근로자가 5,000명인 어느 회사에서, 출근시간 자유(flexible schedule)제를 시행하기 전에는 총 근로자의 일년 평균 결근일이 3일(표준편차 1일)이었으나, 시행 후 25명의 근로자들을 뽑아 평균 결근일을 조사한 결과 2일이었다면, 이 제도는 과연 이 회사 근로자들의 결근일을 줄이는데 기여한 것일까?

  4. 질문 1 : 잘 만들어진 동전 - 앞면과 뒷면이 나타날 확률이 각각 50%인 동전 확률 50%란 - 무한 번의 확률실험을 할 때 그 중 반은 앞면이 나타난다 ⇒ 동전을 무한 번 던져보기 전에는 앞면이 나타날 확률이 50%라는 사실을 정확히 알 수 없다 질문 2 : 전체 근로자 5,000명 중 25명만 조사 두 질문의 공통점 : 일부분만(10회 또는 25명) 조사

  5. 모집단의 크기 동전던지기 - 무한(infinite), 근로자 - 유한(finite) * 한 의사가 진료한 단 몇 명의 환자가 모집단이 될 수 있다 질문 3 : 이처럼 관심의 대상인 모집단의 크기가 무한일 수도 있고 유한일 수도 있다면, 연구자는 어떤 크기의 모집단을 선택하는 것이 좋을까?

  6. 연구자의 관심대상이 무엇이냐에 따라 모집단의 성격과 크기가 결정되므로, 연구의 목표(관심)가 가치가 있느냐로 판단할 문제지, 단순히 모집단의 크기만 생각한다는 것은 무의미하다 다만 연구가치가 있는 모집단일 경우, 크기가 작다면 모집단 자체를 직접 조사하기 쉬운 반면, 크다는 것은 자신의 연구결과가 보다 더 넓은 대상에 적용 모집단자체 조사(전수조사, Census) - 불가능할 수도 있고, 가능하다 하더라도 그것을 조사하는 비용을 고려

  7. 지불할 수 있는 시간적, 경제적 비용의 범위 내에서 조사, 자신의 연구결과의 확대 적용이 가능한 방법 ⇒ 모집단 전체를 잘 대표하는 부분집단(표본)만을 조사한 후 그 결과를 보다 큰 대상(모집단)에 확대 적용시키는 방법 확률표본 모집단을 잘 대표하는 표본? 연구자의 주관이나 편견이 개입되지 않은, 모집단에서 골고루 뽑힌 표본

  8. 골고루?- 모집단의 구성원 어느 누구라도 표본으로 뽑힐 가능성이 같다 랜덤샘플링(random sampling) 확률표본(random sample) 확률표본에서 얻은 결과는 모집단을 정확히 반영? 예, 100명으로 구성된 모집단 자료(평균) 랜덤하게 48명을 뽑았을 때의 평균 또 다시 48명을 랜덤하게 뽑았을 때의 평균 모두 같을까?

  9. 랜덤샘플링 ⇒ 일치한다고 할 수 없다 표본이 가진 정보가 부분적 ⇒ 표본의 정보에 근거한 주장은 어느 정도 불확실성(uncertainty) 모수와 통계량 모수(parameter) - 모집단 분포의 특성을 나타내는 양적(quantitative) 척도 통계량(statistic) - 표본분포의 특성을 나타내는 양적 척도 모수 – 그리스문자 , 통계량 – 알파벳

  10. Sampling 모집단평균 (모수) 표본평균 (통계량) Estimation 추정(Estimation)

  11. 4.8 4.2 4.4 모집단 평균 4.5 4.6 4.5 추정량 : 추정에 사용된 통계량 추정량은 어느 정도 믿을 수 있는가? ⇒ 표본평균은 모평균과 얼마나 가까운가?

  12. 표준오차(S.E., standard error) : 표본평균의 표준편차 95% C.I.(confidence interval)

  13. 가설검정(Hypothesis test) 미지의(unknown) 모수에 대한 주장이나 추측의 옳고 그름을 판정하는 과정 구체적으로 주어진 값과 비교, 여러 집단들간의 차이를 밝힌다 통계적 가설(statistical hypothesis) - 모수에 대한 주장이나 추측

  14. 대립가설(alternative hypothesis) 연구자가 입증하고자 하는 가설 기존의 이론이나 다른 사람들의 주장과 반대되는 가설 “차이가 있다”, “다르다”, “더 크다” H1 귀무가설(null hypothesis 또는 영가설(zero hypothesis)) 연구자의 새로운 주장이나 생각에 반대 “차이가 없다”, “더 크지 않다” H0, 등호(=, equal) 질문 4 : 질문 1의 동전던지기 문제에서 귀무가설과 대립가설은 무엇인가?

  15. H0 : 동전 앞면이 나타날 확률은 50%이다 H1 : 동전 앞면이 나타날 확률은 50%가 아니다 질문 5 : 질문 2의 결근일 문제에서 귀무가설과 대립가설은 무엇인가? H0 : 출근시간 자유제를 실시해도 결근일이 줄지는 않는다 H1 : 출근시간 자유제를 실시하면 결근일이 줄어든다 통계적 가설과 연구가설 “차이가 없다”라는 것을 밝히는 것이 연구자의 목적이라 하더라도, 통계적 검정에서는 그 것을 대립가설이 아닌 귀무가설로 둔다

  16. 동등성 검정(equivalence test) “차이가 없다”를 대립가설로 단측검정과 양측검정 대립가설의 형태에 따라 분류 일방향성(direction) - 단측검정(one-sided test) 양방향성 - 양측검정(two-sided test) 질문 6 : 질문 1과 2는 단측검정과 양측검정 중 어디에 해당되는가? 질문 1은 양측, 질문 2는 단측검정

  17. 단측검정은 귀무가설을 기각하게 될 가능성이 양측검정보다 두 배 더 높다 특별한 이유가 없는 한 양측검정 사용 기각역과 채택역 귀무가설이 옳을 때, 검정통계량(test statistic)이 취하는 영역을 두 부분으로 나눈 후, 표본자료에서 계산된 검정통계량의 값이 어느 영역에 속하느냐에 따라, 귀무가설을 기각(reject) 또는 채택(accept)하는 절차로 진행 검정통계량: 통계적 가설검정을 할 때 사용하는 통계량. 가설의 종류, 자료의 분포(측정치의 척도) 등에 따라 검정통계량이 달라지며, 검정통계량의 분포를 검정의 이름으로 사용하는 경우가 많다. 예, t 검정

  18. 귀무가설이 옳다고 가정? 왜 대립가설이 옳다고 가정한다고 하지 않았을까? 질문 1의 동전던지기 : 귀무가설이 옳다면 동전의 앞면이 나타날 확률은 50% ⇒앞면이 나타날 확률이 50%라는 조건하에서 동전을 10번 던졌을 때 그 중 6번의 앞면을 얻을 가능성을 계산할 수 있다 대립가설이 옳다고 했을 때 - 앞면이 나타날 확률이 50%가 아닌 어떤 다른 숫자일 것이라고 추측할 수 있을 뿐, 그 숫자를 구체적으로 알 수 없다. 그리고 앞면이 나타날 확률을 모르는 상태에서는 10번 중 6번의 앞면이 나타날 가능성을 계산할 수 없다

  19. 귀무가설을 채택하는 영역을 채택역(acceptance region), 기각하게 되는 영역을 기각역(critical region) 가설검정의 절차 1. 귀무가설과 대립가설을 세운다 2. 검정통계량을 정한다 3. 표본자료로부터 검정통계량의 값을 계산한다 4. 계산된 값이 속하는 영역에 따라 결론을 내린다

  20. 검정의 결론 기각역과 채택역의 결정 표본이 모집단으로부터 랜덤하게 뽑혔고 귀무가설이 옳다면, 표본에서 얻은 결과도 귀무가설에서 생각했던 값과 비슷하게 나타날 것 귀무가설이 틀렸다면 귀무가설에서 생각했던 값과는 상당한 차이를 보일 것 어느 정도의 차이?

  21. 예. 두 집단의 비율(PA, PB) 차이 귀무가설 : PA= PB, 대립가설 : PA PB 검정통계량 Z = (pA- pB) / {(pA- pB)의 표준편차} 만약 귀무가설 PA= PB 라면, Z값은?

  22. 유의수준(α), 기각역, 채택역, P-value

  23. 가설검정은 귀무가설을 중심으로 진행 ⇒ 가설검정의 결론, 항상 귀무가설을 중심으로 표현 “귀무가설을 기각한다”, “귀무가설을 채택한다” “귀무가설을 기각할 수 없다”는 표현이 더 일반적으로 사용 “자신이 얻은 자료로부터 귀무가설을 부정하고, 대립가설을 주장할 만한 충분한 근거를 찾을 수 없었다” “차이가 없다”를 직접적으로 증명한 것이 아니라, “충분한 수의 표본이 뒷받침되거나, 다른 연구에서는 혹시 발견될지도 모르는 차이가, 현 시점에서의 자신의 연구에서는 발견되지 않았다”라는, 대립가설에 대한 주장을 잠정적으로 보류한 표현

  24. 두 가지 오류 가설검정은 모집단이 아닌 표본을 조사한 상태에서 모집단에 대한 어떤 주장을 하는 것이므로, 귀무가설을 기각하든 채택하든, 즉 어떤 결론을 내리더라도 다음과 같은 두 가지 오류를 범할 수밖에 없다

  25. 유의수준(significance level, α) 제 1종의 오류(type I error) - 귀무가설이 옳은데도 기각되는 오류 유의수준 - 이 오류를 범할 확률의 최대 허용한계 ⇒ 실제로 차이가 없는데도 불구하고, 차이가 있다고 한, 연구자의 주장이 잘못될 확률 특정 값 이하가 되도록 미리 정한다 0.01, 0.05, 0.10

  26. 검정력 제 2종의 오류(type II error) - 귀무가설이 거짓일 때 이를 채택하는 오류 β - 오류를 범할 확률 실제 차이가 있어서 연구자의 새로운 주장이 옳은데도 불구하고, 차이가 없다고 잘못 주장할 확률 검정력(power of test) : 1- β 값 실제 차이가 있을 때 그 차이를 발견할 가능성 α 와 β 를 동시에 작게 하는 방법 - 표본의 수를 크게

  27. P값(P-value) 관측된 유의수준. 확률값(probability value) 귀무가설(차이가 없다)이 옳은 경우에, 연구자의 표본에서 계산된 검정통계량의 값이 그 이상 극단적으로 나타날 확률 P=0.03의 해석 : “차이가 없다는 것이 사실이라면, 표본에서 이 만큼의 차이가 나타날 확률이 0.03 밖에 되지 않는, 아주 드문 현상이 벌어진 것이다. 따라서 표본에서 이 만큼의 차이가 나타나는 이유는, 실제로 차이가 있기 때문이다” ⇒ 차이가 있다라는 주장에 대한 강한 증거

  28. P=0.30 “차이가 없다고 하더라도, 표본이 우연히 그 만큼의 차이를 보일 가능성이 흔하므로(30%), 차이가 있다는 충분한 증거가 되지 않는다”로 해석 검정은 반드시 해야 하는가? 검정의 정의 - 표본이 가진 부분적인 정보를 이용하여 모집단에 대한 일반화된 결론을 유도하는 과정 조사대상 : 모집단, 표본에 따라 결정 전수조사(census) - 모집단 자체를 조사 표본조사(sample survey) - 표본을 조사

  29. 검정의 예 동전던지기 질문 1의 귀무가설 - 앞면이 나타날 확률이 50%이다 검정통계량 & 표준정규분포를 한다고 가정

  30. 중심극한정리(central limit theorem) : 원 자료가 어떤 모양의 분포(평균 μ, 분산 σ2)를 하더라고, 표본의 수가 많다면(n이 30이상) 표본평균은 근사적으로 평균 μ, 분산 σ2 /n인 정규분포를 한다 유의수준 5%에서의 기각역 P값

  31. 만약 10번 던져 앞면이 9번이나 나타났다면? 유의수준 5%, 기각역(±1.96의 바깥쪽) 출근시간 자유제 질문 2, 귀무가설 “평균 결근일이 줄어들지 않았다” 대립가설 “줄어들었다” H0 : μ≥3, H1 : μ <3 단측검정 귀무가설의 값 3이상 - 등호에 해당하는 값, 3을 사용

  32. 모집단의 표준편차를 1일로, 분포모양은 정규분포라고 가정 ⇒ 귀무가설이 옳다면, 표본평균은 평균 3일, 표준편차 1/ =0.2일인 정규분포

  33. 중심극한정리(central limit theorem) : 원 자료가 어떤 모양의 분포(평균 μ, 분산 σ2)를 하더라고, 표본의 수가 많다면(n이 30이상) 표본평균은 근사적으로 평균 μ, 분산 σ2 /n인 정규분포를 한다 표본평균의 분포 모집단(평균 3일, 표준편차 1일) 표본평균은 평균 3일, 표준편차 1/ =0.2일인 정규분포를 한다? 표본을 구성한 25명은 랜덤

  34. 표본을 랜덤하게 뽑는 이유는 모집단을 잘 대표하는 표본을 얻기 위해 어느 누가 25명의 표본을 랜덤하게 뽑더라도, 표본평균( )은 모집단의 평균(귀무가설이 옳은 경우, 3일)과 같을 것이라는 뜻 25명을 랜덤하게 뽑아 계산한 표본평균들, 모평균 근처의 값

  35. 표본평균의 평균과 분산(예) 항아리 속에 0과 1이 적혀있는 공이 각각 50개씩 (모)평균은 50/100=0.5, (모)분산은 (0-0.5)2이 50개, (1-0.5)2이 50개 → 100×0.25/100=0.25 2개의 공을 랜덤하게 뽑아 평균을 구하는 행위를 반복 나올 수 있는 두 숫자는 (0, 0), (0, 1), (1, 0), (1, 1) 뿐 이 숫자들이 나타날 가능성은 모두 1/4로 동일 →각 숫자(표본)들의 평균은 0, 0.5, 0.5, 1 표본평균의 평균은 2/4=0.5, 분산은 (0-0.5)2+(0.5-0.5)2+(0.5-0.5)2+(1-0.5)2/4=2×0.25/4 =0.25/2

  36. 표본의 크기가 2인 표본을 뽑았을 때, 표본평균의 평균은 변함이 없고, 표본평균의 분산은 모집단 분산을 표본수 2로 나눈만큼 작아진다

  37. 일반화, 평균 μ, 분산 σ2 인 모집단에서 크기 n 인 표본을 뽑으면, 표본평균의 평균은 μ 로 모집단의 평균과 동일하며, 표본평균의 분산은 σ2 /n 이 된다 표준화(standardization) 평균 μ, 표준편차 σ인 확률변수(X)의 분포를 평균 0, 표준편차 1인 분포로 바꾸는 것 모든 자료에 일정한 값이 더해진 경우, 평균은 (원자료의 평균+일정한 값) 일정한 값이 곱해지면, 평균은 (원자료의 평균×일정한 값), 표준편차도 (원자료의 표준편차×일정한 값)

  38. 응용 : T-score(평균 50, 표준편차 10) X  (μ, σ2 ) → Z =  (0, 1) → T = Z 10 +50 특정 확률변수로부터 자신의 평균을 뺀 값을 자신의 표준편차로 나누어 주면 표준화가 이루어진다 N(μ, σ2 ) → N(0, 1)

  39. 임상시험과 통계 임상시험(Clinical Trials) 의약품임상시험관리기준(KGCP, 식품의약품안전청 고시) “의약품의 안전성과 유효성을 증명할 목적으로, 해당 약물의 약동, 약력, 약리, 임상적 효과를 확보하고, 이상반응을 조사하기 위하여, 사람을 대상으로 실시하는 시험 또는 연구”

  40. 임상시험계획 승인 신청시 제출자료 • 임상시험계획 승인 신청서 • 임상시험계획서(Protocol) • 약품의 제조, 판매, 수입 등 관련 시설의 적절성을 입증하는 자료 • 자가기준 및 시험방법 • 안전성, 유효성 관련 고시된 자료

  41. 임상시험계획서 • 임상시험의 목적과 배경 • 관찰항목, 임상검사항목 및 관찰검사방법 • 피험자의 선정, 제외기준, 목표한 피험자의 수 및 그 근거 • 임상시험의 방법(투여량, 투여방법, 병행용법 등) • 효과 평가기준, 평가방법 및 해석방법(통계분석방법)

  42. 임상시험과 통계 • 제 3상(Phase III) 임상시험 • 치료적 확증시험 (Therapeutic Confirmatory Trial) • Comparative randomized controlled trial • 1998년, ICH(International Conference on Harmonisation) : E9, Statistical Principles for Clinical Trials • 2000년, 식품의약품안전청(의약 65625-13353호). 임상시험 통계지침

  43. “확증시험은 가설이 미리 제시되고 평가되는 통제된 임상시험을 말한다. 일반적으로 확증시험은 안전성 또는 유효성에 대한 확실한 증거를 제시하여야 한다. 이러한 임상시험의 주된 가설은 임상시험의 주요 목적으로부터 도출되고, 미리 정의되며, 임상시험의 완료시에 검정이 뒤따라야 한다. 확증시험에서는 연구 대상이 되는 치료 효과의 크기를 적절한 정밀도를 가지고 추정하는 것 뿐만 아니라 이것을 임상적 유의성과 연관시켜 따져보는 것이 모두 중요하다.

  44. 임상시험 설계에 대한 정당성 및 계획된 분석 원칙과 같은 중요한 통계적 측면 등은 임상시험계획서에 명시되어야 하며 각 임상시험은 제한된 수의 가설들을 다루어야 한다” 통제된 임상시험 (Adequately controlled trial) - Inclusion/Exclusion criteria - Design & Monitoring : Randomization, Blinding

  45. 임상시험의 가설 주요 목적 (안전성 또는 유효성에 관한 내용) - 미리 정의 (임상시험계획서; Protocol) - 임상시험의 완료시에 검정- 제한된 수 (결과평가변수; Outcome, Endpoint) Primary, Secondary 임상시험에서 가설검정을 하는 이유?

  46. - 해당 질병을 가진 환자들 중 일부만 참여 :표본(Sample) - Generalization : 참여하지 않은 모든 환자에게 임상시험에서 얻은 결론을 적용 : 모집단(Population) 임상시험에서의 가설 : 비교유형에 따라 구분 우위성 평가시험(Superiority Trial) 위약 또는 대조약에 대한 우위성 동등성 평가시험(Equivalence Trial) 대조약과 시험약의 유효성의 정도가 동등 생물학적 동등성 평가시험 비열등성 평가시험(Non-inferiority Trial) 시험약의 유효성이 대조약에 비해 비열등

  47. 효능·효과의 심사기준 의약품 등의 안전성·유효성심사에 관한 규정 (식품의약품안전청 고시 제2001-35호) 의약품 유효성이 명확하게 실증될 수 있는 질환명 또는 증상명 등을 의약학적으로 인정되는 범위에서 되도록 구체적으로 표시하여야 하며 근거가 불명확하거나 막연하고 광범위한 의미의 표현을 하여서는 아니된다. 해당 적응증에 대하여 임상적 유의성이 있는 경우 이를 인정한다.

  48. 의료용구 유효율에 의하여 평가하는 경우 유효율이 66.7%이상인 적응증 등에 대하여 유효한 것으로 인정함. 다만, 의료용구의 특성 또는 적응증 등에 따라 타당한 사유가 있다고 판단되는 경우에는 합리적인 범위안에서 유효한 것으로 인정할 수 있음

  49. 임상시험 평가지침(식약청 내부문서) • 신약의 임상시험평가일반지침 • 항암제 임상시험평가지침 • 항균제 임상시험평가지침 • 부정맥용제 임상시험평가지침 • 혈압강하제 임상시험평가지침 • 소염진통제 임상시험평가지침 • 고지혈증 개선제 임상시험평가지침 • 노인에 사용되는 의학품의 임상시험평가에 관한 지침 • 임상시험성적서 작성지침

  50. 연구 대상수(Sample Size) ICH : E9, Statistical Principles for Clinical Trials 식품의약품안전청(의약 65625-13353호). 임상시험 통계지침 알아내고자 하는 의문에 신뢰성있는 답을 제공할 수 있도록 충분히 커야 한다. 연구대상수는 보통 임상시험의 주요 목적에 근거하여 결정된다. 연구대상수가 주요 목적과는 다른 점을 근거로 결정되는 경우에는 그 이유가 분명히 정당화되어야 한다.

More Related