노벨 화학상 알파폴드3, 오픈소스로 공개
구글딥마인드는 최근 ‘알파폴드 3’를 완전하게 공개한다고 발표했다. 이제 과학자들은 알파폴드 3의 소소 코드를 내려받아 자신들의 컴퓨터에 설치해 연구에 활용할 수 있다. 누구라도 학술적인 용도로 알파폴드 AI를 이용해 단백질을 연구할 수 있다는 뜻이다.
이번 무료 공개는 비영리 학술 연구를 위해 이뤄졌다. 하지만 상업적 활용이 가능할지 여부에 대해서도 학계와 제약 업계의 관심이 집중되고 있다.
데미스 허사비스 구글딥마인드 최고경영자와 함께 노벨 화학상을 받은 존 점퍼 연구원은 과학전문지 네이처에 "사람들이 이걸로 무엇을 할지 매우 기대된다"고 말했다.
◇무료로 활용… 제약사엔 제한= 알파폴드 3는 계산생물학(computational biology)에 새로운 가능성도 제시했다는 평가다. 신약 개발, 생명공학, 농업 등 다양한 분야에서 활용할 수 있다. 알파폴드 3의 소스 코드는 비상업적 용도로 무료 공개되어 연구자들이 자유롭게 접근할 수 있다. 이는 비영리 학술 연구 목적으로는 누구나 사용할 수 있다는 뜻이다. 단 가중치 모델은 요청 시에만 사용할 수 있다. 우리나라 학자들 또한 이 AI 모델을 통해 단백질 구조와 다양한 생체 분자 상호작용을 연구에 활용할 수 있게 됐다.
학계에서 사용은 가능하지만 상업적 용도로 활용하려는 제약사들은 구글 딥마인드와 별도의 라이선스 계약을 통해 허가받아야 한다. 즉 신약 개발의 과정에서 알파폴드 3를 상업적 목적으로 사용하는 것은 제한된다는 뜻이다. 구글 딥마인드는 상업적 라이선스를 요청하는 기업들에 대해 개별 검토를 진행하고 있는 것으로 알려지고 있다.
생명과학 연구자들은 알파폴드 3가 제공하는 고도의 예측 정확도를 활용해 단백질 연구의 효율성을 크게 향상시킬 수 있게 됐다. 장기간 실험을 통해 확보해야 했던 결과물을 AI를 통해 단기간에 정확하게 확보해 이를 통해 유전 질환, 암, 감염병 등 다양한 질병에 대한 새로운 치료법을 개발하는 연구가 활발해질 것으로 보인다. 특히 신약 개발에 대한 기대가 크다. 신약 개발에는 타깃 단백질의 구조와 상호작용을 정밀하게 이해하는 과정이 필수다. 알파폴드 3는 이런 과정을 혁신적으로 가속할 수 있다. 복잡한 생체 분자의 구조와 결합부위 예측을 고도로 자동화함으로써 기존의 실험적 연구 과정을 보완할 수 있기 때문이다.
신약개발을 지원하는 AI는 또 있다. 구글딥마인드 외에도 여러 기업이 오픈소스 단백질 구조 예측 도구를 공개했다. 중국 검색 기업인 바이두가 헬릭스폴드(Helixfold)를 선보였고 틱톡 개발사인 바이트댄스도 동참했다. 미국의 차이 디스커버리(Chai Discovery)도 경쟁에 뛰어들었다. 알파폴드가 쏘아 올린 공이 경쟁으로 이어지고 있는 셈이다
◇알파폴드도 고성능 GPU가 필요해= 알파폴드 3를 효율적으로 활용하기 위해서는 고성능의 컴퓨팅 장비가 필수적이다. 알파폴드 3는 딥러닝을 기반으로 한 모델이다. 단백질 구조 예측을 위해서는 대규모 데이터와 복잡한 계산이 필요하다. 고성능 장비가 있어야 단백질의 각 원자 좌표를 예측하는 과정에서 빠르고 정확한 결과를 확인할 수 있다. 다수의 단백질과 생체 분자 상호작용을 예측해야 하는 연구 환경에서 고성능 GPU는 필수적이다. 대부분의 AI와 유사하게 역시 알파폴드 3도 GPU의 도움이 필요하다.
알파폴드 2는 일반적인 연구용 GPU나 엔비디아 ‘V100’ 이상의 GPU에서도 실행 가능했으나 알파폴드 3는 V100의 후속인 ‘A100’ 이상의 GPU를 사용해야 원활하게 사용할 수 있다고 알려지고 있다. A100은 현재 국내 슈퍼컴퓨터에 주로 사용되고 있는 GPU 기종이다.
고가의 GPU 자원이 한정된 국내 대학 연구실 상황에서는 무료로 알파폴드 3를 사용할 수 있어도 연구에 제약이 있을 수 있다는 뜻이다. 최근 서울대 바이오인공지능 연구단이 A100보다 신형인 엔비디아 ‘H100’ GPU 56대를 도입해 연구에 속도를 내는 것은 매우 드문 경우다.
꼭 봐야할 주요뉴스
숨쉬기 힘들어 수천명 조기 사망…"가스실에 사는 ... 마스크영역<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(lboqhen.shop) 무단전재 배포금지>