LLM 기반 비정형 의료기록 정형화·용어 표준화·가명화 기술 확보 추진
[비욘드포스트 김신 기자] 의료데이터 플랫폼 전문기업 에비드넷(EvidNet)이 차세대 보건의료 데이터 표준화 기술 확보에 나선다고 밝혔다.
에비드넷은 2025년부터 추진되는 보건의료데이터 상호운용성 지원 기술개발(R&D) 사업의 일환으로, 거대언어모델(LLM)을 활용한 비정형 의료기록지 정형화 솔루션과 용어 표준화 솔루션, 가명화 솔루션 기술을 단계적으로 확보할 계획이다.
의료현장에는 진료기록, 수술기록, 판독소견, 간호기록 등 다양한 비정형 텍스트 데이터가 축적되고 있다. 다만 병원별로 작성 방식과 용어 체계가 서로 달라, 연구나 데이터 교류에 활용하기 위해서는 사전 정비와 표준화 등 전처리 과정이 수반된다.
에비드넷은 LLM 기반 자연어 이해 기술을 적용해 비정형 의료기록에서 핵심 임상 정보를 자동 추출하고, 이를 구조화된 데이터 형태로 변환하는 정형화 솔루션을 개발한다. 이를 통해 연구자가 수작업으로 데이터를 정리하던 과정을 자동화하고, 데이터 품질과 처리 속도를 동시에 향상시킬 계획이다.
의료데이터 활용 과정에서는 병원별로 상이한 용어 사용이 주요 제약 요인으로 지적된다. 동일한 질환·검사·처치라도 표현 방식이 다르면 데이터 통합과 분석이 어렵다. 에비드넷은 LLM 기반 의미 분석 기술을 활용해 의료기관 내부 용어를 국제·국가 표준 용어 체계에 자동 매핑하는 지능형 용어 표준화 솔루션을 고도화한다.
특히 표준 개정이나 신규 표준이 도입될 경우 이를 자동으로 반영할 수 있는 업데이트 체계를 구축해, 장기적인 유지관리 효율성을 높이는 방안이 추진되고 있다.
의료데이터의 안전한 활용을 위해서는 개인정보 보호가 전제되어야 한다. 에비드넷은 임상 텍스트 및 구조화 데이터에서 개인 식별 가능 정보를 자동 탐지·비식별 처리하는 AI 기반 가명화 솔루션 기술도 함께 확보할 계획이다. 이를 통해 데이터 분석·연구 목적 활용 시 법·제도적 요구사항을 충족하는 동시에, 데이터 활용 가능 범위를 확대할 수 있을 것으로 기대된다.
에비드넷은 이번 과제를 통해 ▲비정형 의료기록 정형화 ▲의료 용어 표준화 ▲가명화 기술을 아우르는 의료데이터 전처리 전주기 통합 기술 체계를 구축한다는 전략이다.
회사 관계자는 “의료 AI와 디지털 헬스케어 산업의 성장은 결국 양질의 표준화된 데이터에서 시작된다”며, “에비드넷은 LLM 기반 기술을 통해 의료기관 간 데이터 상호운용성을 높이고, 연구 및 산업 현장에서 즉시 활용 가능한 데이터 인프라를 구축하는 데 기여하겠다”고 전했다.
에비드넷은 그동안 축적해 온 의료데이터 플랫폼 운영 경험과 데이터 품질 관리 역량을 바탕으로, 이번 R&D 사업을 통해 기술 경쟁력을 한층 강화할 계획이다. 향후에는 해당 기술을 자사 데이터 플랫폼에 통합 적용해 병원·연구기관·산업계가 보다 손쉽게 의료데이터를 연계·활용할 수 있도록 지원할 방침이다.
김신 비욘드포스트 기자 news@beyondpost.co.kr