단배질의 폴딩
단백질. 지방, 탄수화물과 함께 3대 영양소인 단백질 맞다. 그러나 생명체가 대사 과정을 통해 직접적으로 에너지를 얻는 탄수화물, 남는 에너지를 오래 저장하기 위해 만드는 지방에 비해 단백질은 생명체의 기계류를 구성하는 성분이라는 데 큰 차이가 있다. 즉 우리 몸을 구성하고 있는 세포 안에서 일어나는 화학반응을 관장하는 효소들, 세포들을 둘러싸 하나로 지탱해 주는 세포외기질(extracellular matrix) 등이 모두 단백질로 만들어져 있다는 뜻이다. 심지어 손톱과 머리카락의 주성분도 케라틴이라는 단백질이다. 지구상의 생명은 유전 정보는 DNA에 저장하여 후대로 전달하되, RNA를 이용해 유전 정보에 쓰인 대로 단백질을 만들어 형상을 갖추고 기능을 발휘하도록 진화했다. 따라서 단백질이 어떻게 생명체 안에서 만들어지고 쓰이는지를 알 수 있다면 생명 현상을 더욱 깊이 이해하는 시금석이 될 것이며, 나아가 단백질을 우리가 원하는 대로 조작하여 예컨대 병을 치료하고 노화를 억제하는 데 기여할 수도 있을 것으로 상상해 볼 수 있다. 지금은 단백질이 아미노산(peptide)들이 서로 공유결합으로 연결되어 있는 폴리펩타이드(polypeptide), 즉 고분자라는 사실을 당연하게 배우지만, 1900년대 한창 유기화학이 발전하기 시작할 당시에는 아미노산들을 붙이고 붙여서 이렇게 거대한 분자를 만들 수 있다는 것을 사람들이 믿지 못했다. Staudinger가 제안한 “고분자”의 개념이 큰 논쟁 끝에 결국 받아들여지고 폴리에틸렌 등의 고분자가 합성된 이래 단백질도 폴리펩타이드라는 사실을 모두 이해하게 되었다. 그 다음 문제는 개개의 단백질을 이루는 아미노산의 서열(sequence)은 어떻게 되고 서열과 단백질의 기능 사이에는 무슨 관계가 있기에 이렇게 다채로운 기능을 수행할 수 있는 것일까? 였다.
일직선인 폴리에틸렌 사슬 하나를 따로 떼어 높은 온도에서 어떠한 형상을 이루는지 관찰해 보면, 아마도 시간이 지남에 따라 이리 저리 구부러지면서 모양을 계속 바꿀 것이다. 오랜 시간을 지켜보면서 사슬의 끝과 끝 사이의 길이를 재 본다면 평균값을 얻을 수 있고 이를 중심으로 해서 사슬 길이의 분포를 볼 수 있겠지만, 일정한 형태를 유지하려고 들지는 않을 것이라는 뜻이다. 매우 많은 탄소 원자들이 죽 연결된 폴리에틸렌 사슬은 각 원자마다 구부러질 수 있는 방향이 여러 개일 텐데, 하나의 형상만 고집할 이유가 없기 때문이다. 열역학적 관점으로는 가질 수 있는 형상의 개수가 많을수록 엔트로피가 높아지기 때문으로 설명할 수 있다.
반면 단백질은 반복단위인 아미노산들이 아미드(amide) 결합을 통해 연결된다. 아미드 결합을 이루는 카보닐 산소와 아미드 수소는 수소 결합(hydrogen bonding)을 통해 다른 아미드 결합과 서로 상호작용할 수 있다. 즉 전자를 끌어당기는 질소에 연결되어 있는 아미드 수소는 전자가 부족하다 보니 전자가 풍부한 카보닐 산소에 가까이 가고 싶어한다. 따라서 가질 수 있는 다양한 형상 중에 수소 결합을 많이 만들 수 있는 형상이 에너지(정확히는 엔탈피)를 더 낮추어 안정화시킬 수 있다.
이 중에 대표적인 형상이 바로 나선(alpha-helix)으로, 아미드 결합으로 연결된 18개의 아미노산이 오른쪽으로 5바퀴 감기면서 4개 떨어져 있는 아미노산들끼리 나선에 수직하게 수소 결합을 만드는 방식이다. Linus Pauling, Robert Corey, Herman Branson이 이 구조를 1951년에 제안했으며, Pauling은 1954년 노벨화학상을 받았다. 아미노산이 연결된 서열을 1차 구조(primary structure)라고 한다면, 나선은 2차 구조(secondary structure)에 해당하며 다른 대표적 2차 구조로는 판상 모양을 만드는 beta-sheet가 있다.
자연에 존재하는 20종류의 천연 아미노산 중에는 물을 좋아하는 아르기닌 같은 종류도 있지만 소수성이 강한 페닐알라닌 같은 계열도 있다. 나선을 따라 소수성 그룹들이 배열된다면, 물에 노출되기 싫어하는 소수성 그룹들을 가려주기 위해서 나선들은 서로 뭉친다. 소위 말하는 소수성 상호작용(hydrophobic interaction)을 통해 이렇게 만들어지는 형상이 단백질의 3차 구조(tertiary structure)가 되며, 나아가 효소 등으로 기능하기 위해서는 여러 개의 폴리펩타이드들끼리 한번 더 뭉쳐 4차 구조(quaternary structure)를 만드는 일이 흔하다. 이 전체 과정을 접힘 과정, 즉 폴딩(folding)이라 이른다. 단백질이 기능하기 위해서는 서열에 설계된 정보대로 폴딩이 제대로 일어나 올바른 형상을 갖추는 것이 필수적이며, 따라서 서열-형상-기능 사이는 서로 뗄레야 뗄 수 없는 상관관계를 가진다. 예컨대 단백질 효소가 선택적으로 동작하려면 우리가 원하는 구조의 기질(substrate)만 효소 안의 반응 자리에 잘 맞게 결합할 수 있어야 하는데, 폴딩이 잘못되어 반응 자리의 모양이 기질과 맞지 않으면 아무 소용이 없는 식이다.