남호정 교수 "빠르고 효율적인 유효화합물 발굴 기대"
GIST(광주과학기술원) 전기전자컴퓨터공학부 남호정 교수 연구팀은 단백질 서열 기반으로 약물과 표적 단백질의 결합지역 및 상호작용을 예측(Highlights on Target Sequence, HoTS) 하는 인공지능 기술을 개발했다고 21일 밝혔다.
신약개발의 초기 단계인 후보 물질 발굴단계는 표적 단백질에 활성을 보이는 화합물을 찾아내는 단계로써, 수만⋅수십만 개의 화합물로부터 표적 단백질에 활성을 보이는 화합물을 찾아야 하는 힘겨운 과정이다.
이러한 상황을 해결하기 위해 다양한 약물-표적 단백질 상호작용 예측 인공지능 모델들이 개발됐지만, 좋은 예측 성능에도 불구하고 예측 결과에 대한 설명력이 부족하였기 때문에 실제 신약 개발에서 적극적인 도입이 꺼려져 왔다.
그러나 이번에 연구팀이 개발한 모델인 HoTS는 약물-표적 단백질이 결합하는 부분을 사전학습한 후 예측하게 함으로써, 높은 예측 정확도와 함께 약물-표적 단백질 상호작용 예측의 근거도 함께 제시해 신약개발 연구자들에게 보다 신뢰할 수 있는 유효화합물 예측 결과를 제시해 줄 수 있게 됐다.
본 연구는 대규모의 단백질 3차원 구조 데이터베이스로부터 화합물과의 결합지역을 추출해 CNN(Convolutional Neural Network)과 트랜스포머(Transformer) 기반의 딥러닝 모델로 단백질 서열상의 결합지역을 예측할 수 있도록 학습됐다.
결합지역을 학습한 후 해당 학습을 기반으로 하여 더 많은 트랜스포머 계층을 통해 약물-표적 단백질 상호작용을 예측할 수 있으며, 그 결과 딥러닝 모델이 결합지역과 함께 약물-표적 상호작용을 예측할 수 있게 됐다.
결과적으로 HoTS 모델은 다른 딥러닝 모델들보다 더 높은 예측력을 보여줬으며, 결합지역 예측도 단백질 서열 정보만을 사용함에도 불구하고 3차원 구조 기반의 타 예측 모델과 비슷한 수준의 성능을 확인했다.
남호정 교수는 “본 연구성과는 신약 개발 단계 중 유효화합물 발굴의 효율성을 크게 높여주는 기술이며, 무엇보다 3차원 구조 정보가 없는 신규 표적 단백질에 대한 신약 개발의 가능성을 열어줬다는데 의의가 있다”면서 “향후 해당 모델을 통해 약 개발 단계에서의 빠르고 효율적인 유효화합물 발굴이 가능할 수 있을 것으로 기대된다”라고 말했다.
한편, 이번 연구는 ‘설명 가능 인공지능 기반 약물 후보의 독성 및 부작용 예측 시스템 개발’(한국연구재단 중견연구자지원사업), ‘지스트-전남대학교병원 공동연구과제’, ‘GRI(GIST 연구원) 생명노화연구소’ 사업의 지원을 받아 수행됐으며 ‘Journal of Cheminformatics’에 2월 8일자 온라인 게재됐다.
![]() |
| ▲ 남호정 교수와 이인구 석박통합과정생 (사진= GIST 제공) |
[mdtoday=이재혁 기자] 단백질 3차원 구조 정보 없이 신약 개발이 가능한 인공지능 기술이 개발됐다.
GIST(광주과학기술원) 전기전자컴퓨터공학부 남호정 교수 연구팀은 단백질 서열 기반으로 약물과 표적 단백질의 결합지역 및 상호작용을 예측(Highlights on Target Sequence, HoTS) 하는 인공지능 기술을 개발했다고 21일 밝혔다.
신약개발의 초기 단계인 후보 물질 발굴단계는 표적 단백질에 활성을 보이는 화합물을 찾아내는 단계로써, 수만⋅수십만 개의 화합물로부터 표적 단백질에 활성을 보이는 화합물을 찾아야 하는 힘겨운 과정이다.
이러한 상황을 해결하기 위해 다양한 약물-표적 단백질 상호작용 예측 인공지능 모델들이 개발됐지만, 좋은 예측 성능에도 불구하고 예측 결과에 대한 설명력이 부족하였기 때문에 실제 신약 개발에서 적극적인 도입이 꺼려져 왔다.
그러나 이번에 연구팀이 개발한 모델인 HoTS는 약물-표적 단백질이 결합하는 부분을 사전학습한 후 예측하게 함으로써, 높은 예측 정확도와 함께 약물-표적 단백질 상호작용 예측의 근거도 함께 제시해 신약개발 연구자들에게 보다 신뢰할 수 있는 유효화합물 예측 결과를 제시해 줄 수 있게 됐다.
본 연구는 대규모의 단백질 3차원 구조 데이터베이스로부터 화합물과의 결합지역을 추출해 CNN(Convolutional Neural Network)과 트랜스포머(Transformer) 기반의 딥러닝 모델로 단백질 서열상의 결합지역을 예측할 수 있도록 학습됐다.
결합지역을 학습한 후 해당 학습을 기반으로 하여 더 많은 트랜스포머 계층을 통해 약물-표적 단백질 상호작용을 예측할 수 있으며, 그 결과 딥러닝 모델이 결합지역과 함께 약물-표적 상호작용을 예측할 수 있게 됐다.
결과적으로 HoTS 모델은 다른 딥러닝 모델들보다 더 높은 예측력을 보여줬으며, 결합지역 예측도 단백질 서열 정보만을 사용함에도 불구하고 3차원 구조 기반의 타 예측 모델과 비슷한 수준의 성능을 확인했다.
남호정 교수는 “본 연구성과는 신약 개발 단계 중 유효화합물 발굴의 효율성을 크게 높여주는 기술이며, 무엇보다 3차원 구조 정보가 없는 신규 표적 단백질에 대한 신약 개발의 가능성을 열어줬다는데 의의가 있다”면서 “향후 해당 모델을 통해 약 개발 단계에서의 빠르고 효율적인 유효화합물 발굴이 가능할 수 있을 것으로 기대된다”라고 말했다.
한편, 이번 연구는 ‘설명 가능 인공지능 기반 약물 후보의 독성 및 부작용 예측 시스템 개발’(한국연구재단 중견연구자지원사업), ‘지스트-전남대학교병원 공동연구과제’, ‘GRI(GIST 연구원) 생명노화연구소’ 사업의 지원을 받아 수행됐으며 ‘Journal of Cheminformatics’에 2월 8일자 온라인 게재됐다.
메디컬투데이 이재혁 ([email protected])

[저작권자ⓒ 메디컬투데이. 무단전재-재배포 금지]
















































