Work
비전공자로 시작한 CDM 연구와 SCI 1저자 논문
SCI 1저자 게재 (Yonsei Medical Journal, 2024). 자궁내막증과 COX-2 inhibitor 연관성을 CDM 기반 후향적 코호트로 검증한 의료정보학 석사 연구. 의학·역학·CDM은 진입 시점에 모두 처음이었다.
의학·역학·CDM을 새로 익히며 임상 가설을 데이터 구조와 연구 설계로 번역
결과
자궁내막증과 COX-2 inhibitor의 연관성을 CDM 기반 후향적 코호트 연구로 검증했고, 결과는 Yonsei Medical Journal에 SCI 1저자 논문으로 게재됐다.
진입 시점에는 의학, 역학, CDM 모두 처음이었다. 정식 소속은 산부인과학교실이었지만 실제로는 의료정보학과실에 상주하며 의학 연구와 의료데이터 구조를 동시에 익혔다.
이 사례의 핵심은 “비전공자가 논문을 썼다”가 아니다. 낯선 의학 가설을 데이터 구조, 연구 설계, 분석 코드, 학술 글쓰기의 문제로 나누고 각각 닫아간 과정이다.
처음 분해한 것
처음에는 한 덩어리로 보였다. 자궁내막증, COX-2 inhibitor, CDM, 역학 설계, 분석 코드, 논문 작성이 한꺼번에 밀려왔다.
분해해 보니 네 갈래였다.
- 의학 도메인 어휘와 임상 맥락
- 역학 연구 설계와 CDM 도구
- 분석 코드와 시각화
- 학술 글쓰기
이 중 통계와 학술 글쓰기의 일부는 심리학 전공에서 이미 본 결이 있었다. 코드 작업은 직전 NIA 자동화 경험에서 디딤돌이 있었다. 진짜로 새로 익혀야 하는 것은 의학 도메인과 CDM 기반 연구 설계였다.
학문 전체를 처음부터 모두 익히려 하지 않았다. 어디까지가 이미 익숙한 문제이고, 어디부터가 진짜 새 문제인지 먼저 분리했다.
어떻게 닫았나
책으로 기초를 잡고, 빈 틈은 구글링과 ChatGPT로 메웠다. 의료정보학과실에 상주하면서 비공식 자문을 받을 수 있었고, 약물 연구 경험이 있는 약학과 교수님과 연구 설계를 함께 잡았다.
분석과 시각화는 Python으로 처리했다. ChatGPT는 코드 작성, 디버깅, 그래프 작성의 페어 프로그래머처럼 사용했다. 지금은 자연스러운 방식이지만, 2022~2023년에는 연구 워크플로에 LLM을 끼워 넣는 사용법이 아직 널리 정착되기 전이었다.
소수정예 랩이었고 직접 가르쳐줄 사수가 있는 구조는 아니었다. 그래서 더더욱 일을 잘게 나누어, 지금 막힌 것이 의학 지식인지, 역학 설계인지, 코드인지, 글쓰기인지 구분해야 했다.
남은 자산
이 연구 이후 의료데이터를 볼 때 “데이터베이스에 값이 있다”와 “연구 질문으로 닫힌다” 사이의 간격을 더 구체적으로 보게 됐다.
임상 가설은 그대로 분석 코드가 되지 않는다. 변수 정의, 코호트 설계, 제외 기준, 비교군, 통계 해석, 논문 문장으로 번역되어야 한다. 그 번역 과정을 한 번 끝까지 지나간 경험이 이후 CDM, DRB, 연구운영 업무를 이해하는 기반이 됐다.