의료 AI 실전 검증 ′가상 병원′ 시대 개막...임상 환경 시뮬레이터(CES) 도입

의료 AI 실전 검증 '가상 병원' 시대 개막...임상 환경 시뮬레이터(CES) 도입: 김미경 기자 / 기사승인 : 2026-04-14 13:27:07

의료 AI 안전성 검증의 새로운 패러다임 제시

▲ 서울대병원 의생명연구원 특화연구소 김성은 연구교수와 하버드 의대 공동 연구팀은 거대언어모델(LLM) 기반 의료 AI를 동적으로 평가하는 '임상 환경 시뮬레이터(Clinical Environment Simulator, CES)'를 발표했으며, 이 디지털 가상 병원 평가 체계 연구는 국제 학술지 ‘네이처 메디슨(Nature Medicine, IF 50)’ 최신 온라인판에 게재됐다. 임상 환경 시뮬레이터(CES) 작동 패러다임 (사진= 서울대병원 제공)

[mdtoday = 김미경 기자] 과거 데이터 기반의 필기시험 위주였던 의료 인공지능(AI) 평가 체계가 실제 임상 현장을 모사한 가상 병원 환경으로 전환될 전망이다. 서울대병원 특화연구소 김성은 연구교수와 하버드 의대 공동 연구팀은 거대언어모델(LLM) 기반 의료 AI의 실전 대응 능력을 검증하는 ‘임상 환경 시뮬레이터(Clinical Environment Simulator, CES)’를 세계 최초로 개발했다고 밝혔다. 이번 연구 결과는 국제 학술지 ‘네이처 메디슨(Nature Medicine)’ 최신호에 게재됐다.

기존의 의료 AI 평가는 정적인 과거 데이터에 의존해, 실제 임상 현장에서 발생하는 복잡한 연쇄 파급 효과를 반영하는 데 한계가 있었다. 환자의 상태가 시시각각 변하고 처방이 병원의 제한된 자원 소모로 직결되는 역동적인 의료 환경을 기존 방식으로는 평가할 수 없었기 때문이다. 연구팀은 의료 AI 역시 조종사가 비행 시뮬레이터에서 훈련받는 것처럼, 시간 흐름과 자원 제약 속에서 대처 능력을 검증받아야 한다고 분석했다.

연구팀이 구현한 CES는 ‘환자 엔진’과 ‘병원 엔진’이라는 두 가지 핵심 시스템을 동기화해 작동한다. 환자 엔진은 전문의가 정의한 질병 궤적과 실제 전자의무기록을 바탕으로 LLM이 가상 환자의 상태 변화를 모사한다. 병원 엔진은 실제 병원의 시간 데이터를 기반으로 병상, 의료진, 장비 등 현장의 업무 흐름을 재현하며, 초응급 환자 발생 시 자원 우선 할당 체계까지 구현했다.

이 가상 병원 환경에서는 AI의 결정이 환자와 병원 시스템 전체에 미치는 영향이 실시간으로 평가된다. AI가 검사 처방을 지연할 경우 환자 상태가 악화하거나, 특정 환자에게 자원을 과도하게 집중해 다른 환자의 진료 기회가 제한되는 병목 현상 등이 생생하게 구현된다. AI의 모든 결정은 환자 예후와 병원 운영 효율성을 합친 ‘이중 지표 복합 점수’로 산출되며, 시스템을 훼손하지 않으면서 치료를 개선하는 경우에만 높은 평가를 받는다.

이번 연구는 환자를 위험에 노출하지 않고도 시스템의 안전성을 입증할 수 있는 ‘무위험 전임상 테스트 환경’을 제공한다는 점에서 큰 의의를 지닌다. 철저한 검증을 거친 AI가 의료진의 디지털 대리인 역할을 수행하게 되면, 의료진은 행정적 실무 부담을 덜고 환자 대면 진료와 판단이라는 본연의 역할에 집중할 수 있을 것으로 기대된다.

김성은 연구교수는 “가상 병원이 인체의 복잡한 생리적 반응을 완벽히 예측할 수는 없다”면서도 “이번 연구는 의료 AI가 단편적인 문제를 푸는 도구를 넘어, 역동적인 의료 체계 내에 완전하게 통합되어 실제적인 도움을 주도록 검증하는 가장 가치 있는 다음 단계가 될 것”이라고 전했다.

메디컬투데이 김미경 기자([email protected])