본문 바로가기

Biomedical&AI

AI 신약 개발은 돈이 되는가?

반응형

매우 어려운 주제다...

 

본인은 짧은 기간이지만 AI신약개발 업체에서 근무를 한 경험이 있다.

 

내 경험으로만 이 글을 적어보자면...

(개인의견이니 모든업체가 그렇다는것이 아니다.)

 

일단 결론부터 말하자면 현재는 돈이 되기가 어렵다.

(국내 업체에 한정된 이야기임.)

 

내가 현재의 AI 신약개발에 회의적인 이유는 다음과 같다. 

 

1. 국내의 AI 신약개발 업체들은 초기 drug discovery 과정에 집중을 함.

 

fig1. drug discovery 과정

image source: https://www.researchgate.net/figure/Drug-discovery-and-development-timeline-The-current-drug-approval-pipeline-can-take-15_fig1_308045230

 

물론 초기 물질을 AI durg discovery로 좋은 물질을 선별하는것은 중요하지만,

durg discovery 단계보다 pre-clinical, clinical trial에 많은 비용과 시간이 소모된다.

 

초기 부분에 AI를 적용하였다고 전체 process에 엄청난 혁신이 일어나, 비용과 시간이 극단적으로 줄어들지 않는다는 의미이다.

 

2. 인체(biosystem)은 시뮬레이션, AI로 모델링이 어렵다.

 

일단 현재의 AI drug discovery 붐이 생기기 이전에도 CADD(Computer-Aided Drug Design)라는 분야가 있었다.

현재의 AI drug discovery는 크게 보면 deep learning을 사용하는 CADD의 일종으로 볼수있다.

(과거에도 있던건데 "딥러닝"이라는 말로 있어보이게 포장하는 느낌?)

 

이전에는 도킹시뮬레이션, 양자계산 같은 분야가 있었고,

어느정도 예측이 되었지만 그렇다고 예측값이 항상 정확한것은 아니였다.

 

인체 시스템은 여러 계층으로 이루어지는데 계층마다 서로 다른 특징을 가지는것이 특징이다.

유전체 - 전사체 - 단백체 - 대사체

각각 layer별로 다른 성질을 지니며 매우매우매우 복잡하다...

 

이 복잡한 시스템을 일부 실험 데이터를 토대로 모델링 하고, 머신러닝으로 예측 할 수 있으리오...

 

AI 신약개발 예시를 들자면 Drug-target-Interaction (DTI)라는 약물-단백질 상호작용 예측 AI 모델이 있다.

해당 모델은 단백질과 약물의 상호작용 데이터를 기반으로 약물과 단백질 상호작용을 예측하는 모델이다.

이 모델의 한계가 있다면, 학습데이터가 대부분 비어있고(null 값), sparse하다는것이다...

 

https://academic.oup.com/bioinformatics/article/34/17/i821/5093245

 

DeepDTA: deep drug–target binding affinity prediction

AbstractMotivation. The identification of novel drug–target (DT) interactions is a substantial part of the drug discovery process. Most of the computational met

academic.oup.com

 

많은 훌륭한 연구자들이 인체 시스템의 데이터를 수집하고, 모델링을 하고있지만, 

인체 시스템이 너무 복잡하여, 만능 AI는 아직도 먼 미래이다...

 

3. 데이터의 부재

 

국내 AI신약개발 업체의 기사를 보면, 자체 DB에 몇천만건 혹은 몇억건을 가지고 있다는 말이 종종 있다.

스타트업 수준인 AI 신약개발 업체들은 대부분 공개 DB(pubchem, chembl, ZINC DB)에서 수집한 데이터를 사용하는 것을 고려하면 몇천만건을 가지고 있다는 업체의 기사는 그렇게 의미있는 정보는 아닐듯하다.

 

몇몇 업체는 자체적으로 새로운 물질을 가지고 있을 수 도있겠으나, 다른 업체와 공유를 하지않는다.

 

우리가 필요한 데이터는 정제된, 전문가가 curation한 데이터이다.

 

해외는 여러기업이 협업하여 데이터를 공유하는 프로젝트도 있는데...

우리나라는 업체간 협업이 부족한 상황이다.

(혹시 업체간 협업이 필요하다면 연합학습으로 해보길 바란다.)

 

해외의 업체간 데이터 공유 사례 링크를 첨부합니다.

 

https://mlpds.mit.edu/

 

MLPDS – Machine Learning for Pharmaceutical Discovery and Synthesis Consortium

Machine Learning for Pharmaceutical Discovery and Synthesis Consortium  is a collaboration between the pharmaceutical and biotechnology industries and the departments of Chemical Engineering, Chemistry, and Computer Science at the Massachusetts Institute

mlpds.mit.edu

 

4. 본질은 신약개발

 

많은 사람들이 "AI 신약개발"이라고 생각하지만 본질은 신약개발이다.

제약업은 10~20년의 기간이 필요한, 매우 장기간 호흡을 가지는 업종이다.

 

임상시험이 주는 비용적 부담으로 인해, 국내 큰 제약사들은 많은 경우

임상 1상후 라이센스 아웃을 하게된다.

 

현재 AI 신약개발 업체들은 대부분 영세한것(스타트업 규모)을 고려하면 가능할까?? 라는 생각도 든다...

 

여러모로... 신약개발 자체가 쉽지 않은데 "AI"라는 키워드로 너무 쉽게 생각하는건 아닌지 생각이 든다.

 

AI는 도구이고 본질은 신약개발임을 잊지 말기를...