AI/머신러닝 기반 화학물질반응 예측기술 및 통합형 전산 플랫폼 구축 연구팀(PI: 서강대학교 화학과 오한빈 교수)은 한국환경산업기술원의 환경기술개발사업을 2023년부터 수행하고 있는 연구팀으로서 화학사고와 관련된 다양한 화학물질 반응을 AI/머신러닝 기반 기술을 통해 예측할 수 있는 연구방법 및 연관된 테크놀로지들을 개발하고, 이를 활용할 수 있는 통합형 전산 플랫폼을 구축하는 연구를 수행하고 있다. 연구팀은 서강대학교 오한빈 교수, 성봉준 교수, 연세대학교 심은지 교수, KAIST 김우연 교수, 서울대학교 이주용 교수를 포함 총 5개의 연구실로 구성되어 있다.
제조 강국인 한국은 화학산업 규모가 크며 다양한 분야의 화학 관련 공장이 가동되고 있다. 제조 현장에서의 화학반응 관련 사고 예방과 사고원인을 규명하기 위해서는 폭발 및 화재 등과 연관된 화학반응을 예측, 설명할 수 있는 능력이 필요하다. 하지만, 화학 관련 산업현장에서 사용되고 있는 화학물질들이 광범위하기 때문에 엄청나게 다양한 반응들의 가능성을 가진 화학반응들을 모두 정확히 예측, 설명하는 것은 전통적인 화학 방법론으로는 매우 어렵다. 이에 최근에 대두되고 있는 AI/머신러닝 기법을 통해 다양한 반응 가능성을 가진 화학반응들을 예측하며, 이를 활용할 수 있는 전산 플랫폼을 개발하는 것을 연구 목표로 연구에 매진하고 있다.
1. 구체적 연구 추진 현황
연구는 총 두 단계로 진행될 계획으로, 1단계인 2023년-2024년에는 화학반응 AI/머신러닝을 위한 훈련 데이터베이스를 구축하고, 그래프 이론에 근거한 반응 네트워크를 구성하며, 머신러닝기반 에너지포텐셜 모델 구축을 위한 머신러닝 알고리즘 개발, 인화점/발화점 예측 인공지능 모델 개발, 첨단분석기기 연계 측정분석법 개발 등의 연구내용을 수행할 계획이다. 2단계인 2025년-2026년에는 그래프 이론 기반 화학 반응예측 모델을 최종적으로 최적화·검증하고, 머신러닝 기반 에너지포텐셜을 활용한 반응지도 구축 및 검증, 다양한 산업별·사고유형 별 인공지능 모델 개발, 화학사고 예측 전산 플랫폼 구축, 전산 플랫폼 매뉴얼 제시, 화학사고 대응 매뉴얼 제시 등의 연구를 수행할 계획이다.
화학 반응을 예측하기 위해서 크게 2가지 상호보완적 AI/머신러닝 모델들을 개발하고 있다. 첫째는 그래프 이론 기반의 화학반응네트워크 구축을 통한 모델 개발로써, 반응물, 전이상태, 생성물의 반응경로 예측 및 이와 연관된 열역학/동력학 결과들을 예측하는 방법론이다. 이 연구는 KAIST 김우연 교수 연구팀이 가장 많은 연구 경험과 노하우를 가지고 있어 주도적으로 연구를 진행하고 있다. [그림 3]은 이와 같은 분자 그래프 기반 화학반응 네크워크 생성 방법의 워크 플로우의 단계별 연구 내용을 설명하고 있다. [그림 4] 는 이와 같은 방법론을 통해 코발트 수소화 화학반응 결과를 예측한 예시 결과를 보여 주고 있다. 이 방법론은 화학반응물, 전이상태, 생성물에 중점을 둠으로써 비교적 간단하나, [그림 3]의 단계별 알고리즘의 세밀한 내용을 보완함으로써 예측 정확도를 높이는 전략을 채택하고 있으며, 최근에 결과에 의하면 이런 방법론으로도 매우 높은 반응 예측 정확도를 보이는 것으로 보고되고 있다.
둘째는 광범위한 화학반응들에 대한 DFT (Density Functional Theory) 계산결과를 기반으로 하여 양자화학 데이터베이스를 구축하며, 화학반응물, 반응경로의 주요 중간체, 전이상태, 최종산물 등의 에너지값들을 활용함으로써 역장(Force Field)을 구축하여 동역학 계산을 하는 연구를 수행하고 있다. 이렇게 확보된 학습 데이터셋을 머신러닝함으로써 다양한 화학반응 결과를 도출하는 연구를 수행하고 있다. 이 방법론 의 경우, DFT 계산연구에 대한 연구 경험이 많은 연세대학교 심은지 교수 연구팀이 양자화학 데이터베이스구축 연구를 수행하고 있고, 화학반응 역장 구축 및 동역학 계산, 역학장 기반 머신러닝 기반 화학반응 예측 기술 개발은 서울대학교 이주용 교수 연구팀이 주도적으로 수행하고 있다. 현재 다양한 Geometric graph neural network 모델들의 성능을 테스트 중에 있다. 대표적인 예로 SchNet 및 PaiNN 모델들의 정확도 도출 등에 대한 주요 모델 성능 테스트를 수행 중에 있다[그림 5]. 위에서 기술한 두 가지 머신러닝 기반 화학반응 예측 모델 외에 본 연구사업을 수행하기 위해서는 화학사고 예측에서 주요한 역할을 하는 인화점, 발화점 예측 머신러닝 모델을 개발할 필요가 있다. 최근에 서강대학교 성봉준 교수 연구팀에 서는 발화점 관련 R2값이 0.888 인 높은 예측력을 가진 모델을 개발하였다[그림 6]. 또한, 화학반응 모델을 검증하기 위한 분석기기 연계 측정분석법 개발을 서강대학교 오한빈 교수 연구팀에서 수행하고 있다. [그림 7]은 현재 개발 중인 고온 화학반응기의 초기 개발 모습으로, 고온에서 반응된 생성물을 열탈착 가스크로마토그래피 질량분석법(Thermal desorption Gas Chromatography Mass Spectrometry)으로 분석하기 위한 시스템을 개발 중에 있다.
현재 총 4년 간의 연구 중 1년 만이 지난 상태라 연구 결과가 충분하지 않지만, 위에서 기술한 방향으로 연구를 수행함으로써 다양한 화학사고, 특히 2차 화학사고의 예방 및 원인 규명을 위한 획기적인 연구 성과를 도출할 것으로 예상되며, 인공지능 기반 물리화학분야, 환경분야에 세계적인 선도 기술들을 확보할 수 있을 것으로 기대된다.
서강대학교
AI/머신러닝 기반 화학물질반응 예측기술 및 통합형 전산 플랫폼 구축 연구팀
오한빈 연구책임자 서강대학교 화학과 교수
본 연구팀을 이끌고 있는 오한빈 서강대학교 화학과 교수는 서울대학교를 1993년 학부 졸업하고, 토론토대학교에서 Li과 HF 사이의 작살 화학반응의 전이상태를 분광 학적 기법을 통해 구조를 규명하는 반응동력학 및 분광학 연구로 2001년 박사학위를 취득하였다. 그 후, 코넬대학교에서 박사 후 연구원으로 질량분석학 연구를 하다가 2003년 서강대학교 화학과 교수로 국내 연구 활동을 시작하였다. 활발한 질량분석 분야 연구를 진행해 오다가, 2015년부터 인공지능을 활용한 연구를 수행하고 있으며 점차 인공지능 활용 연구 범위를 확장하고 있다. 인공지능을 활용한 가짜 발기 부전치료제 적발 질량분석법(식품의약품안전처), 인공지능 기반 신종 마약 질량분석(대검찰청, 식품의약품안전처), 미세 플라스틱 FT-IR 이미지 인공지능 분석(KOTITI), 인공지능 모델을 활용한 대사체 질량분석(보건산업진흥원) 등 다양한 인공지능 관련 연구과제를 수행 중에 있다.
현재 연구책임자 오한빈 교수 연구실에는 박사 후 연구원 1명, 박사 과정 6명, 석박사 통합 과정 1명, 석사 과정 12명, 기타 3명 등 총 23명이 연구에 매진하고 있다.
대표논문
Eunwoo Choi, Yejin Choi, Hyoyoung Lee, Jae-Woo Kim, and Han Bin Oh“Development of a machine-learning model for microplastic analysis in FT-IR microscopy image.” Bull. Korean Chem. Soc. 2024, 45(5) , 472-481.
Eunwoo Choi, Won Jun Yoo, Hwa-Yong Jang. Tae-Young Kim, Sung Ki Lee, and Han Bin Oh “A machine learning liquid chromatography retention time prediction model augments the dansylation strategy for metabolite analysis of urine samples.” J . Chromatogr. A, 2023, 1705, 464167.
So Yeon Lee, Sang Tak Lee, Seungill Suh, Bun Jun Ko, and Han Bin Oh “Revealing unknown controlled substances and new psychoactive sub- stances using high-resolution LC-MS/MS spectra machine-learning models and hybrid similarity search algorithm.” J .Anal. Toxicol. 2022, 46(7), 732-742.
Jae-ung Lee, Yeonjoon Kim, Woo Youn Kim, and Han Bin Oh“Graph theory-based reaction pathway searches and DFT calculations for the mechanism tudies of free radical initiated peptide sequencing mass spectrometry (FRIPS MS): a model gas-phase reaction of GGR tri-peptide.” Phys. Chem. Chem. Phys. 2020, 22, 5057-5069.
Inae Jang, Jae-un Lee, Jung-min Lee, Beom Hee Kim, Bongjin Moon, Jongki Hong, and Han Bin Oh“LC-MS/MS software for screening unknown erectile dysfunction drugs and analogues: artificial neural network classification, peak-count scoring, simple similarity search, and hybrid similarity search algorithms.” Anal. Chem. 2019, 91(14), 9119-9128.
Comentários