인공지능 과학자(AI Scientist) 시대의 과학교육

2시간 전
8분 분량

양수정 | 스탠퍼드대학교 화학과, soojungy@stanford.edu

서 론

안녕하세요. 저는 스탠퍼드대학교 화학과에서 박사후 연 구원으로서 생화학을 위한 인공지능 모델을 개발하는 연구 를 하고 있는 양수정입니다. 내년 2월부터는 듀크대학교 생 화학 및 세포생물학과에서 조교수로 독립적인 연구를 시작 할 예정입니다. 저는 한국에서 고등학교와 대학 학부 과정 을 마쳤습니다. 그래서 한국 과학교육의 힘을 잘 알고, 지금 은 미국에 있지만 제가 받은 것을 다시 돌려드리고 싶은 마 음이 큽니다. 화학세계의 지난 호들을 읽으며 존경하는 선 생님들과 교수님들께서 어떤 고민을 거쳐 교육 활동을 만 들어 오셨는지 엿볼 수 있었습니다. 이번 호 화학교육 칸의 기고를 맡으면서 저도 나름의 고민을 하게 되었는데, 하나 의 흥미로운 시각으로 가볍게 읽어 주시면 감사하겠습니다. 최근 코딩 분야에서는 챗지피티, 클로드와 같은 언어모델 과 에이전트의 능력이 빠르게 고도화되면서, 실리콘밸리의 기존 개발자들이 대규모로 해고되었다는 소식이 들려옵니 다. 실제 물리적 세상에서도 테슬라의 인공지능 기반 완전 자율주행이 이미 도로에서 널리 쓰이고 있습니다. 그러다 보니 언어모델 (Large language model, LLM)과 에이전트 기반 인공지능 (Agentic AI)을 개발하는 사람들은 과학 연구도 코딩처럼 머지않아 자동화될 거라는 예측을 합니다.

물론 과학 연구는 코딩이나 도로 위의 주행과는 다른 점 이 있습니다. 규칙에 따라 논리를 전개하면 되는 코딩이나 도로 위의 주행과 달리, 과학 연구는 실험을 통해 자연세 계를 관찰하는 일이 필수이고, 규칙 자체를 찾아내는 일이 라는 차이가 있습니다.

그러나 이런 자동화의 흐름 속에서 과학자들도 과학 연 구는 어디까지가 자동화될 수 있을까 생각해 보게 됩니다. 자연세계 관찰만 인간이 실험을 통해 하게 되고 가설 수 립, 데이터 분석, 논리 전개는 전부 인공지능이 알아서 하 게 될까요? 지금 연구자들은 인공지능이 자동 탐색으로 무 언가를 발견했다는 소식이 들리면, “그게 얼마나 어려운 문제였나” 가늠해 본 뒤 생각보다 쉬운 문제였다며 안도하 기도 하고, 반대로 불안해하기도 합니다. 저처럼 계산 분 야에 있는 사람에게는 더욱 실감 나는 이야기입니다. 실험 을 하는 사람은 살아남아도 계산과학을 하는 사람은 위태 롭지 않을까 하는 위기의식도 있습니다.

두려움을 이기는 거의 유일한 방법은 그 실체를 이해하 는 것입니다. 그래서 이 글에서는 ‘인공지능 과학자’가 정 확히 무엇이고, 앞으로 무엇이 변하고 무엇은 천천히 변하 거나 변하지 않을지, 그리고 과학교육은 여기에 어떻게 응 답해야 할지를 차례로 이야기해보려 합니다.

본 론

1. 과학을 위한 인공지능

인공지능이라고 하면 이미지나 텍스트를 다루는 모델 을 먼저 떠올릴 수 있지만, 사실 과학에서 데이터 기반 모 델링의 역사는 깊습니다.

아주 단순한 예가 회귀(regression)입니다. x와 y의 관계를 어떤 함수로 설명하도록 함수의 계수를 데이터에 맞 추는 일입니다. 이 함수는 결정론적일 수도 있고 확률적 일 수도 있습니다. 머신러닝 모델이라는 것은 결국 이 함 수를 아주 많은 파라미터로, 아주 유연하게 만든 것이라 고 볼 수 있습니다. 데이터가 많아질수록, 그 많은 데이터 를 두루 설명하려면 더 유연한 모델이 필요해집니다. 지 난 수십 년 동안 이런 유연한 함수를 데이터에 잘 맞추는 최적화 방법이 발전했고, 데이터의 형태에 따라(3차원 구 조인지, 분자 그래프인지, 이미지인지) 알맞은 모델 구조 도 다양하게 개발되었습니다. 또 y = f(x)처럼 입력에서 출력을 맞히는 모델뿐 아니라, 데이터 x의 분포 자체를 학 습해 새로운 x를 만들어 내는 생성모델도 등장했습니다.

이런 모델들로 과학자들은 많은 일을 할 수 있게 되었습 니다. 비싼 양자계산을 대신해 분자의 물성을 빠르게 예측 하는 모델, 알파폴드¹처럼 단백질의 접힘 구조를 예측하는 모델, 어떤 단백질에 가장 잘 결합하는 분자나 단백질의 구조와 서열을 거꾸로 만들어 내는 생성모델, 최근에는 세 포 단위 실험 데이터를 학습해 세포의 상태 변화를 예측하 는 모델까지 나와 있습니다.

여기서 강조하고 싶은 점이 있습니다. 이 모델들은 학 습시킬 좋은 실험 데이터가 있었기에 가능했다는 것입니 다. 알파폴드가 대표적입니다. 단백질의 3차원 구조는 실 험으로 하나하나 밝혀 RCSB라는 공개 저장소에 수십 년 동안 차곡차곡 쌓아 온 데이터가 있었고, CASP라는 구조 예측 대회가 매년 열려 명확한 평가 기준과 공동의 목표 를 만들어 주었습니다. 그러니 알파폴드는 어느 날 갑자 기 인공지능 기술이 좋아져서 가능해진 것이 아니라, 실 험으로 얻은 양질의 데이터, 과학계가 함께 만든 평가 기 준, 그리고 오랜 경쟁과 협력의 역사 위에서 나온 결과입 니다. 이제 알파폴드는 노벨화학상을 받았고 분자생물학 실험실에서 매일 쓰는 도구가 되었습니다. 좋은 데이터를 모으고, 풀어야 할 목표를 뚜렷이 세우고, 모델을 제대로 평가하는 일. 늘 과학의 바탕이었던 이 작업이 앞으로는 과학자의 더욱 중요한 역할이 될 것입니다.

2. 자동화되는 가설 세우기

가장 최근 단계의 데이터 기반 인공지능 모델은 바로 언어 기반 추론모델과 에이전트입니다. 이들은 논문을 요약 하고 탐색하며, 데이터 분석을 대신하고, 가설까지 제안합 니다. 이 모델들이 무엇을 할 수 있는지 조금 더 구체적으 로 최근 Nature에 출판되고 화제가 된 사례를 보겠습니 다. 비영리 연구소 FutureHouse가 만든 Robin²은 여러 인공지능 에이전트가 협업하는 ‘다중 에이전트’ 시스템입 니다. Robin의 에이전트는 수십만 편의 논문을 빠르게 읽 어 정리하고 실험 데이터를 분석합니다.

연구진은 시범 과제로 실명의 주요 원인 가운데 하나인 건 성 황반변성을 골랐습니다. Robin은 관련 문헌을 읽고, 이 미 나와 있는 약물들 중 이 병에 다시 써 볼 만한 후보를 추 렸습니다. 그리고 그 후보들을 검증할 구체적인 실험까지 직 접 설계했습니다. RNA 시퀀싱과 유세포 분석 (flow cy-tometry) 같은 것들입니다. 사람 연구자들은 Robin이 설계 한 실험의 프로토콜을 구체화해 실제로 수행했고, Robin은 그 결과를 분석해 다음 라운드의 후보를 다시 제안했습니다. 이 과정을 반복해 Robin은 리파수딜(ripasudil)을 유력 한 후보로 지목했습니다. 원래 녹내장에 쓰이던 리파수딜 은 ROCK 억제제 계열에 속합니다. 기존 문헌에 (1) 황반 변성 시 망막색소상피세포의 식세포작용 기능이 떨어진다 는 보고와, (2) 특정 ROCK 억제제가 망막색소상피세포의 식세포작용을 끌어올린다는 한 편의 보고가 있었고, 이를 수많은 문헌 속에서 자동으로 찾아 엮어, Robin은 ROCK 억제로 망막색소상피세포의 식세포작용을 끌어올려 건성 황반변성을 치료하자는 기존에 없던 제안을 했습니다. 가설 제안과 실험 설계, 데이터 분석, 그리고 논문 본문의 그림까지 Robin이 자율적으로 만들었고, 사람은 물리 적 실험만을 수행했습니다. Robin을 구상해서 논문을 제 출하기까지 걸린 시간은 약 2.5개월이었고, 이 연구는 2026년 Nature에 출판되었습니다.

비슷한 시기에 구글 딥마인드도 Co-Scientist라는 시스 템을 Nature에 발표했습니다.³ 이쪽은 여러 에이전트가 가설을 내고 서로 비판하며 토너먼트처럼 가설의 순위를 매기는 방식입니다. 급성 골수성 백혈병에 대해 약물 재창 출 후보들을 제안했고, 과학자들이 상위 후보를 골라 실험 실에서 검증한 결과 몇몇 약이 임상적으로 의미 있는 농도 에서 백혈병 세포를 억제했습니다.

성공 사례들을 기반으로 인공지능이 과학연구를 모두 자동화할 것이라는 미래를 그리기 전에, 두 가지를 짚고 싶습니다. 첫째, 이 결과들은 새로운 실험적 발견 그 자체 라기보다 흩어져 있던 기존 지식을 엮어 시험 가능한 새 가설을 만든 것이고, 검증된 부분은 그 가설의 첫 단추까 지입니다. 그러니 기존 지식을 합성하는 것만으로 풀리는 문제도 있겠지만, 그렇게 간단하지 않은 문제도 있을 것입 니다. 둘째, 실험적 검증은 여전히 사람의 영역입니다. 인 공지능이 자동화한 것은 주로 가설을 세우고 실험을 설계 하고 데이터를 해석하는 ‘생각’의 영역이지, 실제 검증이 아니었습니다.

3. 더 중요해지는 것

가설 세우기가 자동화되는 흐름 속에서, 오히려 더 중요 해지는 것들이 있습니다.

첫째는 모델의 편향과 불확실성입니다. 모델은 자신이 학 습한 데이터의 편향을 그대로 물려받습니다. 문헌이 특정 가 설에 치우쳐 있으면 모델의 제안도 그쪽으로 쏠립니다. 또 모델은 자신이 본 적 없는 영역에 대해서도 일단 그럴듯한 답을 내놓습니다. 그래서 ‘모델이 무엇을 확실히 알고 무엇 을 모르는가’를 가늠하는 불확실성 추정은 아직 잘 풀리지 않은 문제입니다. 실험을 통한 검증은 여전히 가용 자원에 한계가 있는 영역이기 때문에, 그럴듯하지만 틀린 가설을 자 꾸 검증하라고 제안한다면 연구가 오히려 비효율적이 될 수 있습니다. 그래서 불확실성을 가늠하는 일이 중요해집니다. 모델 자신의 예측뿐 아니라, 그 바탕이 된 기존 문헌과 지식 을 얼마나 신뢰할 수 있는지까지, 전문가의 판단이나 통계 적 방법으로 정량화하려는 노력이 필요해질 것입니다.

둘째, 자동화가 진행될수록 디테일은 더 놓치기 쉬워집 니다. 그래서 무엇이 말이 되고 무엇이 말이 되지 않는지를 분별하는 비판적 사고, 결과 뒤에 숨은 가정을 찾아내는 훈 련이 더 중요해질 것 같습니다. 이것은 결국 과학적 연구방 법을 얼마나 또렷이 이해하고 있느냐의 문제이기도 합니다. 운동은 감으로도 잘할 수 있지만, 그 방법을 언어로 배 워서 하는 것은 또 다른 일이고, 필요한 동작을 명료하게 설명할 수 있어야 비로소 남을 가르칠 수 있습니다. 과학 도 마찬가지입니다. 인공지능이 더 많은 일을 대신할수록, 과학자는 결과를 감으로 받아들이는 데 그치지 않고 과학적 사고를 하는 방법을 잘 알고 있어야 모델을 제대로 감 독할 수 있습니다.

4. 스케일의 과학

가설 세우기의 자동화와 함께 새로 등장한 흐름은 ‘스케 일의 과학’입니다. 전통적인 과학의 방법은 최대한 깨끗하 고 통제된 데이터를 얻는 것이었습니다. 가설을 먼저 세우 고, 변인을 통제한 실험에서 결론을 끌어냈습니다. 그런데 과학을 위한 인공지능은 꼭 그렇지만은 않습니다. 데이터 가 먼저이고, 거기에서 가설과 변인을 거꾸로 발견합니다. 그리고 때로는 정보량이 많은 소량의 데이터보다 정보량 이 적어도 저렴하고 방대한 데이터가 더 유리합니다. 이 ‘저렴한 데이터가 유리하다’는 말이 직관에 어긋나기도 해 서, 두 가지 예를 들어 보겠습니다.

첫째는 사전학습과 미세조정입니다. 단백질 서열은 매 우 저렴하고 풍부한 데이터입니다. 자연에 존재하는 수억 개의 서열이 공개 데이터베이스에 쌓여 있습니다. 반면 어 떤 효소의 활성도나 어떤 분자의 결합 세기 같은 실험값은 측정에 비용이 많이 들어 수백에서 수천 개 수준입니다. 그래서 요즘 흔히 쓰는 방법은, 우선 값싸고 방대한 서열 데이터로 모델에게 단백질의 일반적인 ‘문법’을 익히게 한 다음(사전학습), 비싸고 적은 실험 데이터로 특정 과제에 맞게 모델을 다듬는 것입니다(미세조정). 값싼 데이터가 좋은 표현을 만드는 무거운 일을 대신 해 주는 것입니다.

둘째는 창발(emergence)입니다. ESM⁴이라는 단백질 언어모델이 좋은 예입니다. 이 모델은 오직 아미노산 서열 만 보고, 마치 빈칸 채우기 문제를 풀듯 가려진 아미노산을 맞히도록 학습합니다. 학습 과정에서 단백질의 3차원 구조 는 단 한 번도 보여 주지 않습니다. 그런데도 모델 내부에 는 어떤 아미노산 잔기들이 공간적으로 가까이 맞닿아 있 는지와 같은 구조 정보가 저절로 나타났고, 이로부터 3차 원 구조를 예측하는 일까지 가능해졌습니다. 진화가 이미 구조적 제약을 서열 속에 새겨 두었고, 모델이 그것을 읽어 낸 것입니다. 구체적으로는, 3차원 구조에서 서로 맞닿아 상호작용하는 잔기들은 한쪽이 변이하면 다른 쪽도 함께 변이해야 구조와 기능이 유지되는 경향이 있고, 그 과정이 서열에 함께 남기 때문입니다. 학습 목표에는 없던 성질이 부수적으로 떠오르는 이 현상이 창발입니다. 값싸고 풍부 한 데이터(서열)에 규모를 더하면, 비싸게 측정해야 했던 성질(구조)이 따라 나올 수 있다는 것을 잘 보여 줍니다.

이렇게 어떤 질문을 할 지 미리 정하지 않은 채 데이터 를 설명하는 모델을 만들고, 거기서 새로운 지식을 발견하 는 새로운 연구 방식은 우리 생각의 순서를 바꾸게 만듭니 다. “이 가설을 검증하려면 어떤 데이터가 필요한가”를 묻 던 자리에 “이 데이터 안에는 어떤 정보가 들어 있고, 무엇 을 물을 수 있는가”를 묻는 감각을 훈련하는 것이 점점 더 중요해질 것입니다.

5. 과학교육은 어떻게 응답해야 할까

새로운 패러다임 안에서 과학교육의 바람직한 자세는 인공지능의 힘을 과대평가하지도, 과소평가하지도 않는 것이라고 생각합니다. 과대평가하면 “어차피 AI가 다 하 니 깊이 배울 필요 없다”는 태도로 흐르기 쉽고, 과소평가 하면 학생이 시대의 도구를 놓치게 됩니다. 언어모델을 어떤 식으로든 활용하는 연구는 지금의 고등학생과 학부 생이 본격적인 연구에 뛰어들 무렵이면 훨씬 더 보편화되 어 있을 것입니다. 그렇기에 지금 그들이 받는 인상과 갖 는 태도가 중요하다고 생각합니다.

“언어모델이 다 아니까 내가 배울 필요는 없다”, “언어 모델이 대신 생각해 주니 내가 애써 생각할 필요는 없다” 는 태도는 위험합니다. 오히려 AI를 더 잘 활용하고, AI가 틀렸는지 아닌지를 분별하려면 더 깊이 알아야 합니다.

그러려면 언어모델의 도움을 받아 실제 연구 프로젝트를 끝까지 해 보는 경험도 도움이 될 것 같습니다. 그 과정에 서 언어모델의 사고가 가진 한계에 갇히지 않는 법을 익혀 야 합니다. ‘언어모델의 비판적 활용’ 자체에 점수를 줄 수 도 있을 것 같습니다. 예를 들어 AI가 내놓은 답의 허점을 찾아내거나, AI의 답에 숨어 있는 검증되지 않은 가정을 찾 아내는 활동입니다. 올바른 답을 얻기 위해 언어모델에 어 떻게 질문해야 하는지 연습하는 것도 필요할 것 같습니다.

결 론

조금 더 먼 미래를 상상하면, 가까운 장래에는 인간 학생뿐 아니라 ‘인공지능 학생’을 위한 과학교육도 고민하 게 될지 모릅니다. 언어모델에게 과학을 잘 하는 법을 어 떻게 가르칠 것인가는 이미 하나의 연구 주제입니다. 흥 미로운 것은, 우리가 과학의 방법을 더 또렷하게 언어로 정리할수록 그것을 사람에게도 기계에게도 더 잘 가르칠 수 있게 된다는 점입니다. 과학교육과 인공지능 연구가 같 은 질문 앞에서 만나게 될 것입니다.

그래서 다시 처음의 질문으로 돌아오면, 인공지능 과학 자의 역할과 한계를 이해하는 일은, 막연한 두려움을 이 기는 길인 동시에 이 강력한 도구를 비판적으로 잘 활용하 는 길이기도 합니다. 무엇이 빠르게 변하고 무엇은 천천 히 변하거나 변하지 않을지를 가늠하는 것, 그리고 그 위 에서 학생들에게 무엇을 어떤 뉘앙스로 전달할지 고민하 는 것이 지금 우리에게 주어진 숙제라고 생각합니다. 이 토론을 여러분들과 함께 이어 갈 수 있다면 좋겠습니다.

Jumper, J.; Evans, R.; Pritzel, A.; et al. Highly accurate protein structure prediction with AlphaFold. Nature 2021, 596, 583.
Ghareeb, A. E.; Chang, B.; Mitchener, L.; et al. A multi-agent system for automating scientific discovery. Nature 2026, advance online publication. DOI: 10.1038/s41586-026-10652-y.
Gottweis, J.; Weng, W.-H.; Daryin, A.; et al. Accelerating scientific dis-covery with Co-Scientist. Nature 2026, advance online publication. DOI: 10.1038/s41586-026-10644-y.
Lin, Z.; Akin, H.; Rao, R.; et al. Evolutionary-scale prediction of atomic-level protein structure with a language model. Science 2023, 379, 1123.

양수정 Soojung Yang

• 한국과학기술원 화학과 학사 (2017.2-2020.8)

• AITRICS 신약개발팀 연구원 (2020.8-2021.6)

• MIT 컴퓨터및시스템생물학 박사

(2021.8 -2026.5, 지도교수: Rafael Gomez-Bombarelli)

• 스탠퍼드대학교 화학과 박사후 연구원 (2026.5-현재, 지도교수: Grant Rotskoff)

• 마이크로소프트 리서치 방문연구원 (2026.5 -현재)

• FutureHouse 박사후 연구원 펠로우 (2026.9-2027.1)

듀크대학교 의과대학 생화학 및 세포생물학 과 조교수 부임 예정(202