이러다 보면 알고 있는 조건에 따라 반응만 할 수 있는 시스템이 아니라, 궁극적으로는 어떻게 반응하는 것이 가장 효과적(무엇이 효과적인지에 대한 정의는 다양할 수 있다. 생성물을 가장 많이 얻을 수 있는지? 반응하는 데 드는 에너지가 가장 적은지? 반응 시간이 가장 짧은지?)인지, 혹은 더 나아가 물질은 알려져 있는데 만들 수 있는 반응 경로는 모를 때 이를 찾아내거나, 아예 아직 알지 못하는 신물질의 합성 경로는 무엇인지를 찾아내는 시스템을 개발할 수 있을까에 생각이 미치게 된다. 역시 AI가 현대의 화두로 떠오른 덕이다.
무엇을 배우느냐에 따라 커서 어떤 사람이 될지 달라지는 것처럼, AI도 자신이 학습한 데이터의 영향을 매우 크게 받는다. 데이터 세트가 한쪽으로 편향되어 있다면 AI는 세상이 모두 그런 것처럼 생각하게 되고 따라서 질문에 대한 답도 그쪽으로 낼 가능성이 높다.
문제는 어떤 브랜드의 가방을 사람들이 가장 많이 검색하는지에 관한 빅데이터는 구글에서 쉽게 가져올 수 있는 반면, 어떻게 하면 반응을 가장 잘할 수 있는지에 대한 빅데이터는 얻기가 만만치 않다는 것이다.
전에 썼던 것처럼, 필자와 같은 연구자들은 연구 결과를 정리해서 논문을 쓰는 것이 중요한 일이다. 바라기로는 무엇이 되었든 풀고자 하는 문제에 대한 유의미한 답을 찾고 이로써 인류의 지식 축적과 기술 진보에 도움이 되는 결과를 얻어야 논문을 쓴다. 학술지에 투고된 논문은 편집자와 리뷰 절차를 통과한 경우에만 출판되어 다른 연구자들이 볼 수 있게 된다. 당연히 모든 연구가 성공해서 논문화될 수 있는 것은 아니며, 실패한 연구는 설 자리가 없다(다른 얘기지만, 이는 연구과제에서도 마찬가지다. 도전적인 연구를 장려한다면서 목표한 수치를 맞추지 못하면 실패 판정을 받고, 향후 연구과제를 받는 데 페널티를 부여한다면 누가 실패할 가능성이 있는 연구를 하겠는가). 다시 말하면, 논문으로 발표된 연구들은 성공한 결과만을 모아놓은 굉장히 편향된 데이터 세트라는 것이다. 모르기는 몰라도 백 배가 넘는 실패한 데이터들이 각 실험실에 쌓여 있을 것이다. 그러나 이런 데이터들은 접근할 수가 없으니 논문에 나와 있는 데이터에만 의존하여 AI를 학습시키면, 마치 뭐든지 다 될 줄로만 아는 겉똑똑이 AI가 나올 수밖에 없다. 각 논문에서 사용하는 실험 조건들이 똑같을 리가 없으므로 같이 묶어 비교하기 쉽지 않은 점이 문제를 더욱 복잡하게 만든다.
이럴 거면 차라리 다양한 조건을 설계하고 체계적으로 실험해서 빅데이터를 직접 만들자는 이야기가 나오게 된다. 한 실험실에서 몇십 년간 유사한 종류의 반응으로 다양한 화합물을 합성해 본 결과(성공과 실패를 모두 기록한!)를 가지고 모델을 만들어서 AI를 학습시킨 후 새로운 반응 경로를 찾아보게 했더니 전문적인 연구자 뺨치는 수준으로 예측했다는 결과도 최근에 보고된 바 있다. 그런데 이것도 만만한 일이 아니다. AI의 성능은 학습한 데이터의 질과 양에 모두 의존하며, 당연히 양이 많을수록 좋다. 또한 앞서 언급한 사례에서는 같은 실험실에서 축적된 데이터였다 보니 그나마 편차가 작았다고 보이지만, 사람이 하는 실험은 사람마다 손맛이 다를 수밖에 없어서 특히 숙련되지 않은 초보 연구자의 경우 결과가 뒤죽박죽일 수 있다.
알아서 반응할 수 있는 자동화 반응 시스템은 이런 측면에서 매력적인 선택지가 될 수 있다. 전력과 시약이 계속 공급된다면 24시간 1년 내내 쉬지 않고 일할 수 있고, 반응에 실패했다고 기죽지도 않고, 유지 보수를 잘해준다는 전제하에 실험을 시작한 오늘과 1년 후에 테크닉이 크게 변하지도 않는다(물론 더 좋은 장치를 쓰고 프로그램을 다듬으면 좋아질 수는 있겠다). 이로써 일관성 있는 빅데이터를 축적하고 이를 AI에 학습시켜 새로운 물질을 개발하는 토대로 삼자는 것이다.
벌써 작년에 Lawrence Berkeley National Laboratory에서는 자동화된 합성과 기계학습을 결합해서 합성 경로와 물질 설계를 최적화할 수 있다는 내용의 논문을 출간한 바 있다. 이 정도 되면 이제 자동화 실험실(autonomous laboratory)와 가상 실험실(virtual laboratory)가 융합된 미래 실험실에 가깝다 할 만하다. 필자가 꿈꾸는 미래기도 하다.
글을 마무리하면서 머릿속에서 떠나지 않는 질문은 다음과 같다. 그런데 이 모든 것들이 이루어진다면 필자의 삶이 과연 지금보다 쉬워질까…?