[제이앤피메디 칼럼] 임상시험 데이터 표준화 전환점, 왜 지금인가(표준화 로드맵)
임상시험 업계에서 '표준화'라는 단어는 새롭지 않다. 하지만 그동안 표준화는 대부분 제출을 위한 형식 맞추기에 머물렀다. 각 연구마다 데이터는 제각각 쌓였고, 제출 단계에 이르러서야 변수 이름을 바꾸고, 용어를 통일하고, 누락된 값을 채우며 밤을 새웠다. 표준화 과정에서 오류가 발견되면 프로그램 코드를 고쳐야 했고, 검증 결과와 제출 데이터가 맞지 않으면 같은 과정을 반복해야 했다.
이러한 방식은 막대한 비용과 시간을 소모했을 뿐 아니라, 데이터 품질에도 근본적인 한계를 드러냈다. 연구 설계 단계에서 관리되지 않은 불일치는 제출 직전에 억지로 손 봐도 흔적이 남아 일관성을 해쳤다. 겉보기에는 구조가 같은 것처럼 보여도 신뢰성은 보증 되지 않았다.
2025년은 임상 데이터 표준화에 있어 결정적인 전환점이다. 올해 1월 의약품국제조화회의(ICH)는 새로운 임상시험 관리기준(GCP) 지침 E6(R3)을 최종 채택했고, 같은 달 한국은 세계 최초로 디지털의료제품법을 시행했다. 이어 3월에는 ICH M11의 기술 사양(Technical Specification)이 업데이트 됐고, 다가오는 11월에 ICH M11의 최종화를 예정하고 있다. 유럽의약품청(EMA)은 7월부터 E6(R3)를 시행하고 있다.
즉, 이제는 표준화 도입을 더 이상 미룰 수 없는 시점이다. 규제 기관의 움직임이 본격화 됐고, 업계는 변화에 맞춰 준비해야 한다. 이제 필요한 것은 '표준이 중요하다'는 선언이 아니라, 실제로 어떻게 준비할 것 인가에 대한 구체적인 방향이다. 이번 글에서는 세 단계 로드맵을 바탕으로 표준화를 바라보는 하나의 관점을 나눠보려 한다.
[기초단계] 국제 표준 다시 읽기
표준화 로드맵의 첫 단계는 국제 표준을 정확히 이해하고, 실무에 어떻게 적용할지 익히는 것이다. 단순히 이름을 아는 수준에서 멈추는 게 아니라, 실제 업무 속에서 활용할 수 있는 감각을 기르는 과정이다.
◆CDISC 데이터 표준: SDTM(Study Data Tabulation Model), ADaM(Analysis Data Model), CT(Controlled Terminology) 등으로 구성된 CDISC 데이터 표준은 데이터를 국제적으로 통용되는 언어로 맞추는 역할을 한다. 표준 가이드라인 및 용어집을 내려받는 것에 그치지 않고 실제 자사 데이터에 매핑해 표준 적용 전후 차이를 비교해보는 것이 좋은 출발점이다.
◆PRM(Protocol Representation Model, CDISC): 프로토콜을 구조화해 SDTM·ADaM으로 이어지도록 설계된 모델. 작은 규모의 프로토콜이라도 PRM 틀에 맞춰 변환해보는 시도로 시작할 수 있다.
◆FHIR(Fast Healthcare Interoperability Resources, HL7): 병원 EMR/EHR, 연구 시스템, 앱 등의 데이터 교환을 가능케 하는 의료데이터 표준으로, 파일럿 프로젝트를 통해 EHR에서 직접 데이터를 연결해보는 시도가 필요하다. 차후 데이터 표준 자동화 및 후향적 RWD 연구 등에 활용할 수 있다.
기초단계는 결국 '왜 표준화가 필요한가', '무엇을 따라야 하는가', 그리고 '어떻게 업무에 녹여낼 것인가'를 배우는 훈련이다. 규정을 읽는 데서 멈추지 말고, 샘플 매핑과 파일 구조 실습을 통해 다음 단계로 이어져야 한다.
[확장단계] 내재화 및 검증
두 번째 단계는 표준을 현업에 실제로 적용하는 것이다. 표준화를 아는 것에서 한 발 더 나아가, 표준화 업무를 조직의 프로세스에 반영하는 과정이 필요하다. 이와 동시에 그 적용 결과를 검증할 수 있는 절차가 마련돼야 한다.
◆CORE(CDISC Open Rules Engine): CDISC가 제공하는 오픈소스 룰 엔진으로, 규칙 검증을 자동화한다. 사람이 수작업으로 하던 품질관리(QC) 일부를 CORE로 돌리고, 검증 보고서(Validation Report)를 조직의 표준 산출물로 보관하는 체계를 마련해야 한다.
◆Pinnacle 21: CDISC 표준 데이터가 규제기관 제출 요건에 맞는지 검증 기능을 제공하는 툴로, SDTM·ADaM 규칙을 자동 검증한 결과로 생성된 검증 보고서와 이슈 기록부(Issue Log)를 축적하면 이를 작은 라이브러리처럼 활용할 수 있다. 이러한 경험은 결국 조직 내 저장소(Repository) 구축의 씨앗이 되며, 특히 규모가 작은 조직이 점진적으로 표준화 역량을 쌓는 데 효과적이다.
◆ICH E6(R3): ICH E6(GCP 가이드라인)의 R3 개정에 따라 품질을 사후 검증이 아니라 설계 단계에서 확보해야 한다. 이를 위해 프로토콜 작성 시 품질 관리 항목을 체크리스트화해 반영하는 훈련이 필요하다. 위험 기반 품질 관리(Risk-Based Quality Management, RBQM)와 전자 기록(Electronic Records)·감사 추적(Audit Trails) 강화 역시 문구 해석에 그치지 않고, 워크숍이나 내부 교육을 통해 실제 절차로 구체화해야 한다.
이 단계에서 조직은 표준화를 '개념'이 아니라 '경험'으로 체득하게 된다. 이렇게 체득한 원칙과 도구들을 표준 운영 절차에 녹여내 내재화하고, 이를 통해 데이터 품질을 상시적으로 검증할 수 있는 기반을 마련한다. 더불어 축적된 검증 결과를 활용하면 프로젝트별 대응을 넘어 조직 차원의 품질관리 체계로 확장할 수 있다.
[정착단계] 프로토콜-투-데이터 완성
세 번째 단계는 앞선 노력들이 조직 차원의 자산으로 정착하는 것이다. 이 과정의 출발점은 전자 프로토콜이다. 프로토콜이 문서가 아니라 데이터 구조로 정의되면서 이후의 모든 표준화 활동은 그 위에서 설계·운영·분석으로 이어진다.
◆ICH M11: ICH M11은 임상 전자구조조화 프로토콜(Clinical electronic Structured Harmonised Protocol, CeSHarP)로, 실제 프로토콜 작성에 활용 가능한 표준 템플릿과 관련 기술 사양(Technical Specification) 등으로 구성된다. ICH M11은 단순한 문서 표준화가 아닌 디지털 프로토콜 구축을 위한 글로벌 가이드라인이며, 프로토콜은 더 이상 사람이 읽는 PDF 등의 문서가 아닌 컴퓨터가 해석할 수 있는 데이터 구조(머신-리더블)로 전환된다. 방문, 엔드포인트, 기준값 등이 전자적으로 정의돼 바로 eCRF, 분석 데이터셋, 제출 메타데이터로 이어진다. 즉, 전자 프로토콜은 데이터 표준화 정착의 첫 단추이자 시작점이다.
◆USDM(Unified Study Design Model, CDISC): 연구 설계 정보를 통합적으로 관리하기 위한 것으로, 프로토콜·CRF·분석·제출까지 이어주는 통합 모델이다. 방문 스케줄 같은 항목을 USDM을 적용해 연구 전반에 걸쳐 같은 정의를 사용해보는 것이 좋다. 업계는 확장성 마크업 언어(XML) 또는 자바스크립트 객체 표기법(JSON)같은 구조화된 포맷으로 직접 확인해보며 '머신-리더블'의 표준화된 방식으로 임상시험을 수행해보는 경험이 필요하다. 이러한 경험이 축적되면, 연구 설계 단계에서 정의한 정보가 그대로 후속 단계에 재사용되는 구조가 정착돼 불필요한 반복 작업이 줄고 일관된 데이터 흐름이 실현된다.
◆MDR(Metadata Repository): 전자 프로토콜이 흘러갈 길을 단단히 다지는 인프라다. 반복되는 변수·용어·구조를 라이브러리화해 재사용성을 높이고, 일관된 설계·운영을 지원한다.
정착단계의 핵심은 전자 프로토콜을 시작점으로, USDM과 MDR로 이어지는 일관된 구조를 통해 프로토콜에서 데이터셋까지 자동화된 흐름을 완성하는 것이다. 이때 MDR은 단순한 저장소가 아니라, 연구 설계와 운영 전반에서 반복적으로 재사용되는 자산이 되어 데이터의 일관성과 품질을 뒷받침한다. 이러한 체계를 기반으로 표준화를 실무 전반에 적용할 때, 비로소 표준화는 조직의 경쟁력을 결정짓는 지식 자산으로 자리 잡게 된다.
지금까지 살펴본 3단계 여정은 글로벌 변화와 맞닿아 있다. ICH M11과 E6(R3)가 방향을 제시했고, CDISC 등의 기관에서 제공하는 기준 및 도구들이 이를 실무에 구현하는 기반이 됐다. 또한, 한국도 디지털의료제품법과 전자 제출 시범사업을 통해 이 흐름에 합류했다.
준비하지 못한 조직은 여전히 제출 직전 형식 맞추기에 매달리며 비용과 시간이 늘어나고, 글로벌 진출에도 제약이 생긴다. 반대로 준비된 조직은 재사용 가능한 자산, 자동화된 검증, 향상된 품질이라는 성과를 얻는다. 이는 글로벌 규제기관과 기업이 인정할 만한 신뢰도로 이어지고, 결국 국제 공동연구·파트너십 기회를 넓히는 힘이 된다.
데이터를 설계하고 관리하며 활용하는 데에는 여러 방법이 있을 수 있다. 하지만 여러 대안을 비교해도 프로토콜부터 데이터셋까지를 가장 효율적으로 이어주는 지름길은 언제나 표준화다. 이것이 단순한 규제 대응을 넘어, 조직의 경쟁력을 결정짓는 핵심 전략이 되는 이유다.