목차
CDM 이란?병원 자료 기반의 CDM분산연구망 (Distributed Research Network, DRN)분산연구망을 이용한 CDM의 장점과 그 한계국내 CDM 시장 현황References
CDM 이란?
- Common Data Model (CDM)은 다양한 데이터 원본에서 수집된 데이터를 표준화된 형식으로 변환하는 데 사용되는 구조화된 데이터 모델입니다. CDM은 데이터를 표준화된 형식으로 변환하여 다양한 응용 프로그램 및 분석 도구에서 데이터를 쉽게 공유하고 활용할 수 있도록 합니다.
- 데이터베이스에 직접 접근하지 않아도 데이터를 분석, 설계할 수 있으므로 정보 보안에 효율적입니다.
병원 자료 기반의 CDM
현재 우리나라 병원들이 각자 다른 전자 의료 기록(EMR) 시스템을 도입함으로써 저장된 의료 데이터의 종류와 구조가 서로 달라, 의료 기관 간에 분석 결과를 교류하는 것이 어려웠습니다. 이러한 한계를 극복하고 보건의료 정보의 공익적 활용가치를 극대화하기 위해 Common Data Model (CDM)을 도입하게 되었습니다.
특징적으로 미국 식품의약국(FDA)에서 개발한 Sentinel CDM(Sentinel Common Data Model)과 국제 의료 빅데이터 표준화 연구 컨소시엄인 OHDSI의 OMOP CDM(Observational Medical Outcomes Partnership Common Data Model)을 한국 실정에 맞게 적용한 것이 특징입니다.
CDM을 의료 데이터 산업에 도입함으로서 얻는 효과는 아래와 같습니다.
- 의료 데이터 표준화: 다양한 의료 데이터 원본(진료 기록, 검사 결과, 수술기록, 약물처방기록 등)에서 수집된 데이터를 일관된 형식으로 표준화하여 저장합니다.
- 의료 데이터 관리: 표준화된 의료 데이터를 효율적으로 관리하고 저장할 수 있습니다. 이는 의료 데이터의 보안, 접근 제어 및 데이터 무결성을 유지하는 데 중요한 역할을 합니다.
- 의료 연구 및 의사 결정 지원: 표준화된 데이터 모델을 사용하여 의료 데이터를 쉽게 분석하고 의료 연구를 수행할 수 있으며, 의사들이 환자 정보에 기반하여 의사 결정시에 사용할 중요 근거가 됩니다.

분산연구망 (Distributed Research Network, DRN)
분산연구망은 CDM을 기반으로 여러 기관의 공동 연구를 위해 연합되어 있는 연구망을 의미합니다. 분산연구망은 아래와 같은 방식으로 진행됩니다.
- 병원 및 청구 데이터 등을 가지고 있는 데이터 보유 기관이 기관의 데이터를 CDM으로 변환 및 표준화
- 동일한 분석코드를 분산연구망 참여 기관에 보내며, 기관은 이를 분석하고 도출한 집합정보(평균, 합, 표준편차 등)만 기관 외의 연구자에게 회신합니다.
- 기관 외의 연구자는 여러 집합정보를 취합 및 분류하여 결과적으로 환자의 개별정보는 보유하지 않으면서도 실제 여러 기관의 자료를 모아 분석한 것과 같은 결과를 만들 수 있습니다.
분산연구망을 이용한 CDM의 장점과 그 한계
장점
- 환자의 개별정보를 수집하지 않기 때문에 보안성이 높고, 여러 기관의 분석정보를 취합하기에 데이터의 다양성이 보장됩니다.
- 또한 대규모의 데이터셋을 활용하여 큰 규모의 연구가 가능합니다.
한계점
- EMR, EHR 등의 임상데이터를 분석하는데에 효과적이지만 생체신호, 라이프로그, 유전체 정보 등의 대규모 비정형자료를 포함할 수 없습니다.
- 적재된 데이터를 한꺼번에 분석하는 데에 초점이 맞추어져 있어, 상대적으로 실시간으로 쌓이는 데이터를 반영하지 못합니다.
국내 CDM 시장 현황
의료 빅데이터/AI 전문기업인 에비드넷(Evidnet)이 운영중인 플랫폼 피더넷(Feedernet)에서 의료 AI 개발이 가능한 연합학습(Federated Learning) 기능을 선보였습니다.
- 피더넷은 국내 50여개의 대형 종합병원들의 의료 데이터를 CDM으로 표준화를 기반으로 데이터를 관리 및 통합분석결과 서비스를 제공하는 RWD(Real World Data) 플랫폼입니다.
- 연합학습은 여러 기기 등에서 분산된 데이터를 사용하여 모델을 학습하며, 실제 의료기관의 데이터는 실제로 공유되지 않고, AI 모델 학습이 가능하기 때문에 데이터의 개인 정보 보호에 민감한 의료 데이터의 AI 연구방식에 더 적합합니다.

- 비정형자료를 분석에 포함하지 못하는 분산연구망의 한계를 극복하기 위해 CDM의 확장모델을 개발하고 있습니다.

References
Share article