서명은 교수의 과학이야기

로봇이 미치는 

화학 실험의 놀라운 혁명


알아서 척척척

어린 시절 아이작 아시모프의 로봇 시리즈를 자주 읽었다. 어머니께서는 다닐 같은 로봇이 있어서 집안일을 해 줄 수 있으면 그건 사볼 만하겠다고 하셨다. 그게 30년 전 이야기인데, 사람 대신 여러 가지 일을 해낼 수 있는 로봇이 아직 바로 옆에 와 있는 것 같지는 않다. 필자도 이런 로봇이 있어서 실험실에 두고 쓰면 좋겠다는 생각을 한다. 스스로 화학 반응을 할 수 있는 로봇!


 

로봇에게 반응을 시키고 나는 그동안 놀 수 있다면(혹은 그 시간을 더욱 유익하게 쓸 수 있다면) 아주 바람직하다 할 수 있다. 사실 한 종류의 반응만 계속 해서 매우 많은 양을 만들 거라면 로봇이 아니라 화학 공장을 지으면 된다. 화학 공장을 가 보면 많은 부분이 자동화되어 있어 사람의 손이 갈 필요가 없는, 굉장히 거대한 자동화 반응기라 할 만하다. 반면 조금조금씩 다른 화합물을 만들고 싶다면 공장은 가성비가 훌륭한 선택이 아니다. 아마 아주 작은 스케일에서는 미세유체장치(microfluidic device)와 같이 수십-수백 마이크로미터 수준의 눈에 잘 보이지 않는 채널들로 이루어진 초소형 반응 장치가 나을 수도 있다. 다만 미세유체장치에서 생산되는 양은 생각보다 매우매우 작기 때문에 뭔가 손에 쥐고 가지고 놀 만한 정도의 물질을 만들기에는 적합지 않다. 

필자의 실험실에서는 양 극단의 중간쯤인 약 0.1 그램에서 1 킬로그램 사이의 스케일을 주로 다루고, 수행하는 반응도 그때그때 다르다. 떨어뜨리거나 부딪히면 깨지는 유리 플라스크(흔히 초자라고 부른다)와 유리, 플라스틱, 금속 등으로 만들어진 부품들을 조심조심 조립하고 안에 화학 물질을 담아서 휘젓거나 끓이면서 반응을 돌린다. 사람이 다루어도 초자를 깨 먹는 일이 드문 것은 아니지만, 액체가 들어있는 유리 용기를 잡기에 이상적인 각도로 손을 뻗어 적당한 만큼 힘을 주어 잡고서 액체를 흘리지 않고 다른 용기에 따르는 일을 로봇에게 시키려면 생각보다 많은 고민이 필요할 듯싶다. 달걀을 깨뜨리지 않고 잡을 수 있는 로봇 손을 만드는 기술이 고난이도인 까닭이다. 아기도 쉽게 깨지는 물체와 단단한 물체를 분간하고 어느 정도의 힘으로 각각을 잡는 것이 적당한지 학습하고 손을 정교하게 움직이게끔 익히는 데 상당한 세월이 걸린다. 로봇의 경우 약하고 강한 힘을 모두 구현할 수 있는 말랑말랑한 그립을 만드는 것도 문제지만, 개인적으로는 예측하지 못한 상황에 부딪혔을 때 적절히 대응할 수 있는 능력이 가장 요구되지 않을까 생각한다. 테슬라 공장에서 로봇이 사람을 공격했다는 최근 뉴스를 보면 더욱 그렇다. 

따라서 보다 현실적인 방법은 지금 실험실에 가지고 있는 장비들을 잘 조합해서 자동화 반응 설비를 구축하는 것이다. 펌프를 써서 시약이 들어있는 용기에서 반응기로 필요한 만큼 액체를 옮기고, 반응기의 온도를 조절하며 반응을 수행하고, 반응이 끝나면 다른 펌프를 써서 회전 농축기로 반응 혼합액을 옮긴 후 농축, 여과, 추출, 크로마토그래피 등의 정제 과정을 거쳐 생성물을 얻는 식이다. 물론 이 모든 과정은 컴퓨터로 제어할 필요가 있으며, 갑자기 관이 막힌다든지 하는 비상 사태에도 대비할 수 있는 안전 장치도 있어야 한다(염산과 같은 유독한 물질을 흘려보내다가 관이 압력을 견디지 못하고 터져나가는 상황은 결코 보고 싶지 않다). 이는 지난 가을호에서 예로 들었던 화학 반응 레시피를 컴퓨터가 보고 이해할 수 있어야 한다는 뜻이다. 즉 액체를 섞는 단계, 가열하는 단계 등을 각각의 함수로 만들고 이들을 써서 코딩하는 것이 필요하고, 또 현재 반응이 진행되고 있는 정도를 모니터링하고 피드백하여 필요시 멈추거나 다시 시행할 수 있는 프로그램이 있어야 한다. 이미 2015년에 미국 University of Illinois at Urbana-Champaign의 Burk 그룹에서는 실험실 기구들을 잘 조합하고 이들을 제어할 수 있는 프로그램을 짜서 사람 손을 거치지 않고 유기분자를 합성할 수 있는 시스템을 시연하기도 했다.

요즘의 트렌드라 하면 명실공히 인공지능을 들 수 있다. 이제는 스마트폰에도 AI가 탑재되는 시대다. 현재 AI 기술의 요체는 거칠게 말하면 빅데이터를 학습하여 답을 찾아내는 방법을 깨우치고, 이를 통해 모르는 문제를 풀어내는 것이라 할 수 있다. 인터넷이 발전하여 어마어마한 양의 자료를 검색할 수 있게 된 후에 AI가 등장한 것은 우연이 아닌바, 이제야 비로소 다룰 수 있는 빅데이터가 나타났기 때문이다. 

논문도 마찬가지다. 물론 아직 많은 학술지들은 구독자들만 내용을 볼 수 있도록 하고 있지만, 인터넷만 있으면 모두가 볼 수 있는 open-access 학술지들도 점차 늘어나고 있다(이 경우 논문을 쓴 저자가 출판비용을 낸다). 

스스로 반응을 수행할 수 있는 시스템을 구축했다면, 자연스럽게 그다음 단계는 논문을 던져주면 혼자 논문을 읽고 어떻게 반응할지 공부한 다음 알아서 반응을 돌리는 시스템이 될 것이다. 요즈음 AI들은 글도 잘 읽고 데이터 마이닝도 잘해서, 논문을 보면 어떠한 시약을 써서 어떤 조건에서 반응했는지를 추출해 낼 수 있다.

앞서 작성한 함수와 프로그램이 있으므로 여기에 마이닝된 조건들을 넣어주면 알아서 반응을 수행할 수 있을 것으로 생각할 수 있다. 그러나 역시 현실은 마냥 녹록지만은 않다. 원자들이 서로 연결되어 분자를 이루고 소재를 이루는 화학 물질의 3차원적 구조는 보통 점을 선으로 이어 표시하고 알파벳과 기호를 덧붙여 의미를 나타내는데, 이를 사람의 언어를 기반으로 학습된 AI들이 쉽게 파악하지는 못하는 것으로 알려져 있다. 화학을 잘하면서 AI도 잘 아는 신세대들의 활약이 필요한 시점이다.

이러다 보면 알고 있는 조건에 따라 반응만 할 수 있는 시스템이 아니라, 궁극적으로는 어떻게 반응하는 것이 가장 효과적(무엇이 효과적인지에 대한 정의는 다양할 수 있다. 생성물을 가장 많이 얻을 수 있는지? 반응하는 데 드는 에너지가 가장 적은지? 반응 시간이 가장 짧은지?)인지, 혹은 더 나아가 물질은 알려져 있는데 만들 수 있는 반응 경로는 모를 때 이를 찾아내거나, 아예 아직 알지 못하는 신물질의 합성 경로는 무엇인지를 찾아내는 시스템을 개발할 수 있을까에 생각이 미치게 된다. 역시 AI가 현대의 화두로 떠오른 덕이다. 

무엇을 배우느냐에 따라 커서 어떤 사람이 될지 달라지는 것처럼, AI도 자신이 학습한 데이터의 영향을 매우 크게 받는다. 데이터 세트가 한쪽으로 편향되어 있다면 AI는 세상이 모두 그런 것처럼 생각하게 되고 따라서 질문에 대한 답도 그쪽으로 낼 가능성이 높다. 

문제는 어떤 브랜드의 가방을 사람들이 가장 많이 검색하는지에 관한 빅데이터는 구글에서 쉽게 가져올 수 있는 반면, 어떻게 하면 반응을 가장 잘할 수 있는지에 대한 빅데이터는 얻기가 만만치 않다는 것이다. 

전에 썼던 것처럼, 필자와 같은 연구자들은 연구 결과를 정리해서 논문을 쓰는 것이 중요한 일이다. 바라기로는 무엇이 되었든 풀고자 하는 문제에 대한 유의미한 답을 찾고 이로써 인류의 지식 축적과 기술 진보에 도움이 되는 결과를 얻어야 논문을 쓴다. 학술지에 투고된 논문은 편집자와 리뷰 절차를 통과한 경우에만 출판되어 다른 연구자들이 볼 수 있게 된다. 당연히 모든 연구가 성공해서 논문화될 수 있는 것은 아니며, 실패한 연구는 설 자리가 없다(다른 얘기지만, 이는 연구과제에서도 마찬가지다. 도전적인 연구를 장려한다면서 목표한 수치를 맞추지 못하면 실패 판정을 받고, 향후 연구과제를 받는 데 페널티를 부여한다면 누가 실패할 가능성이 있는 연구를 하겠는가). 다시 말하면, 논문으로 발표된 연구들은 성공한 결과만을 모아놓은 굉장히 편향된 데이터 세트라는 것이다. 모르기는 몰라도 백 배가 넘는 실패한 데이터들이 각 실험실에 쌓여 있을 것이다. 그러나 이런 데이터들은 접근할 수가 없으니 논문에 나와 있는 데이터에만 의존하여 AI를 학습시키면, 마치 뭐든지 다 될 줄로만 아는 겉똑똑이 AI가 나올 수밖에 없다. 각 논문에서 사용하는 실험 조건들이 똑같을 리가 없으므로 같이 묶어 비교하기 쉽지 않은 점이 문제를 더욱 복잡하게 만든다. 

이럴 거면 차라리 다양한 조건을 설계하고 체계적으로 실험해서 빅데이터를 직접 만들자는 이야기가 나오게 된다. 한 실험실에서 몇십 년간 유사한 종류의 반응으로 다양한 화합물을 합성해 본 결과(성공과 실패를 모두 기록한!)를 가지고 모델을 만들어서 AI를 학습시킨 후 새로운 반응 경로를 찾아보게 했더니 전문적인 연구자 뺨치는 수준으로 예측했다는 결과도 최근에 보고된 바 있다. 그런데 이것도 만만한 일이 아니다. AI의 성능은 학습한 데이터의 질과 양에 모두 의존하며, 당연히 양이 많을수록 좋다. 또한 앞서 언급한 사례에서는 같은 실험실에서 축적된 데이터였다 보니 그나마 편차가 작았다고 보이지만, 사람이 하는 실험은 사람마다 손맛이 다를 수밖에 없어서 특히 숙련되지 않은 초보 연구자의 경우 결과가 뒤죽박죽일 수 있다. 

알아서 반응할 수 있는 자동화 반응 시스템은 이런 측면에서 매력적인 선택지가 될 수 있다. 전력과 시약이 계속 공급된다면 24시간 1년 내내 쉬지 않고 일할 수 있고, 반응에 실패했다고 기죽지도 않고, 유지 보수를 잘해준다는 전제하에 실험을 시작한 오늘과 1년 후에 테크닉이 크게 변하지도 않는다(물론 더 좋은 장치를 쓰고 프로그램을 다듬으면 좋아질 수는 있겠다). 이로써 일관성 있는 빅데이터를 축적하고 이를 AI에 학습시켜 새로운 물질을 개발하는 토대로 삼자는 것이다.

벌써 작년에 Lawrence Berkeley National Laboratory에서는 자동화된 합성과 기계학습을 결합해서 합성 경로와 물질 설계를 최적화할 수 있다는 내용의 논문을 출간한 바 있다. 이 정도 되면 이제 자동화 실험실(autonomous laboratory)와 가상 실험실(virtual laboratory)가 융합된 미래 실험실에 가깝다 할 만하다. 필자가 꿈꾸는 미래기도 하다. 

글을 마무리하면서 머릿속에서 떠나지 않는 질문은 다음과 같다. 그런데 이 모든 것들이 이루어진다면 필자의 삶이 과연 지금보다 쉬워질까…?

서명은 

KAIST에서 화학을 전공하여 이학 학사, 석사, 박사 학위를 받았다. 현재 모교인 KAIST 화학과에서 부교수로 재직 중이며, 분자들을 서로 이어 고분자를 만들고 쓸모 있는 소재로 응용하고자 연구하고 있다.   


약력 

2002 KAIST 화학과 이학 학사

2008 KAIST 화학과 이학 박사

2008 – 2009 KAIST 박사후연구원

2009 – 2013 University of Minnesota 박사후연구원

2013 – 2020 KAIST 나노과학기술대학원 조교수, 부교수

2020 – 2023 KAIST 화학과 부교수

2023 – 현재 KAIST 화학과 정교수

발행일: 2024년 2월 창간일: 2014년 7월 등록번호: 영등포, 바00169 발행인: 김동녕 편집기획: 대외협력팀

한세예스24홀딩스 서울특별시 영등포구 은행로 30, 6층 T. 02)3779-0800


Copyright ⓒ 2023 hansaein All rights reserved.