대한소화기학회 교육자료
- 코호트 연구의 이해 -
1. 코호트 연구의
정의:
연구 설계를 구분할 때 중재(intervention)가 있는 경우를 실험 연구, 중재가 없는 경우를
관찰 연구라고 한다. 코호트 연구는 특정 요인(노출, exposure)이 결과(질병,
outcome)에 어떤 영향을 미치는지 알아보기 위해 설계된 관찰 연구이다. 연구 시작 시점에는 참여자들이 질병이 없는 상태에서 시작하며, 이후 특정 요인에 노출되었는지 여부에 따라 시간이 지나면서 어떤 결과가 나타나는지를 추적한다. 이를 통해 노출과 결과 간의 인과관계를 밝히는 것이 코호트 연구의 목표이다.
2. 코호트 연구의
유형
1) 전향적 코호트
연구: 연구 시작 시점에서 특정 요인에 노출된 사람들과 그렇지 않은 사람들을 추적하여 시간이 지나면서
결과가 발생하는지 관찰한다. 미래를 향해 데이터를 수집하기 때문에 시간과 비용이 많이 들 수 있다.
2) 후향적 코호트
연구: 과거의 기록이나 데이터를 기반으로 특정 요인에 노출된 사람들과 그렇지 않은 사람들의 결과를 분석한다. 이미 수집된 데이터를 활용하므로 시간과 비용이 절약되지만, 데이터의
신뢰도와 완전성이 다소 떨어질 수 있다.
3. 코호트 연구의
장점
1) 사건의 순서 파악
가능; 특정 요인에 노출된 후 결과가 발생하는 순서를 명확히 확인할 수 있다.
2) 회상 비뚤림 배제; 연구 참여자들이 과거 경험을 기억하는 데 의존하지 않고, 사건 발생
전 데이터를 수집하므로 기억의 왜곡을 최소화할 수 있다.
3) 시간적 요인의
교정 가능; 생년월일, 연령, 연구 기간 등 시간에 따른 변수를 고려해 연구 결과를 보정할 수 있다.
4) 대표성 있는 데이터
수집; 대표 자료(representative data)를
확보하여 연구 대상이 일반 인구를 대표할 수 있게 되면, 연구 결과를 더 폭넓게 일반화할 수 있다.
4. 코호트 연구
설계 시 주요 고려사항
1) 대상 집단 선정
- 연구 집단(study population): 일반 인구나 특정 질병 환자 집단 등 다양한 그룹을 대상으로 연구를 설계할
수 있다. 단 대상의 특성과 측정 지표를 명확히 정의해야 한다.
- 중재 정의: 진단 코드, 임상 상태, 검사
결과, 약물 사용, 치료 기간 등 중재와 관련된 기준을 설정한다.
2) 발생 환자 설계(incidence case design)
- 유병 환자를 대상으로
코호트를 구성할 경우, 약물 시작 시점(inception)에서
추적이 시작되지 않아 약물 시작 직후 발생한 결과가 분석에서 제외되는 선택 비뚤림(selection bias)이
발생할 수 있다. 또한 연구 중 시간에 대한 평가가 불가능하다.
- 빅데이터 연구는
환자의 임상 정보가 제한적이므로, 질병 경과의 중증도에 대한 파악을 위해 발생 환자(incidence case)를 보는 것이, 일부 중증도에 대한 문제를
최소화할 수 있다.
- 발생 환자만을
대상으로 할 경우, 연구 초기에 질병이 없던 사람들만 포함하여 결과를 추적할 수 있다. 이로 인해 약물 시작 직후 발생하는 사건을 분석에 포함할 수 있어 선택 비뚤림을 줄이는 데 도움이 된다.
- 발생 환자를 정의하기
위해 연구 시작 전 일정 기간 동안 질병이 없었음을 확인하는 '사전 질병 없는 기간(washout period)'을 설정해야 한다. 단, Washout period가 너무 짧으면 연구 대상자가 잘못 분류될 가능성이 높아진다. 예를 들어, 질병을 오랫동안 앓아온 대상자가 발생 환자로 잘못 분류될
위험이 있다.
3) 연구 기간 설정
- 시작 시점: 진단일, 치료일, 중재
효과를 감안한 특정 기간(induction period) 이후 등으로 정의가 필요하다. 특히 대조군(질병이 없거나 treatment
of interest를 받지 않은 경우)의 경우 진단일 혹은 치료일이 없으므로 주의해야
한다.
- 종료 시점: 사건 발생일, 연구 종료일, 또는
경쟁 사건이 발생한 시점으로 정의할 수 있다.
4) 경쟁 사건
- 보고자 하는 결과(예: 치료에 따른 생존/사망)가 나타나기 전에 다른 결과(예: 교통사고에
의한 사망)가 발생하여, 보고자 하는 결과가 발생 불가능한
경우, 분석에서 제외하거나 중도 탈락으로 처리해야 한다.
5) 비뚤림의 관리
- 불멸 시간 비뚤림(immortal time bias): 노출군에서 사건이 발생하지 않는 기간이 부적절하게 포함되는 경우 발생한다. 즉, 불멸 시간이 중재군에 잘못 귀속되거나, 중재군의 추적 기간이 대조군보다 늦게 시작하여 분석에서 제외될 때 발생한다.
이에 대한 대처로는 불멸 시간 무시, 불멸 시간을 치료 기간으로 처리, 불멸 시간을 치료하지 않은 기간으로 계산하고 patient clock을
치료 시작점으로 설정, 치료 기간을 시간 의존(time-varying)으로
매개변수화(parametrization) 하는 방법 등이 있다.
- 오분류 비뚤림(misclassification bias): 중재 상태나 결과를 잘못 분류하는 경우 발생하며, 정확한 측정을 통해 최소화해야 한다.
- 감시 비뚤림(surveillance bias): 중재군에서 더 많은 검사가 이루어져 결과 발생률이 높아지는 경우를 뜻한다. 대조군에서도 유사한 검사를 수행하도록 설계해야 한다.
- 선택 비뚤림(selection Bias): 연구 집단 선정 과정에서 특정 대상이 과소/과대
대표될 경우 발생하며, 무작위 표집(random sampling)을
통해 해결 가능하다.
- 측정 비뚤림(measurement Bias): 결과나 노출 상태가 정확히 측정되지 않을 때 발생하며, 표준화된 도구와 절차를 사용해 개선해야 한다.
- 회상 비뚤림(recall Bias): 후향적 연구에서 과거의 노출을 기억하지 못하거나 왜곡되는 경우로 전향적 설계를 통해
이를 방지할 수 있다.
6) 교란 요인(confounding factors)
- 중재와 결과 모두에
영향을 미치는 요인은 교란 요인으로 작용할 수 있으며, 중요한 교란 요인은 사전에 정의하고, 분석에 포함해 보정해야 한다.
- 하지만, 중재로 인해 영향받는 변수(중재 이후 매개 변수)를 교란 변수로서 보정하는 것은 비뚤림을 야기할 수 있으며, 교란
변수가 결과 변수에 특이성을 갖는 것인지에 대한 정의도 필요하다.
- 교란 요인의 발생에는
제공자측 요인(provider action), 환자 요인(patient
action), 환경-사회적 요인, 의료서비스에
대한 접근성 등이 있다.
- 시간 변동 교란
요인(time-varying confounders): 중재 이후에 측정되거나 중재에 영향을 미치는 변수들은
시간 의존적으로 분석해야 한다.
- 잔존 혹은 비측정
교란 요인: 직접적으로 측정할 수 없어서 다른 변수로 보정하고자 새로운 변수를 측정하는 경우, 혹은 측정되지 않았거나 분석에 사용하지 않은 경우 발생할 수 있다. 측정되지
않거나 통계적으로 보정되지 않은 교란 요인을 최소화하기 위해 대리 변수를 사용하거나 추가 데이터를 수집해야 한다.