[사회] 연세대, 미생물 유전체 복원 분석 전략 제시
-
7회 연결
본문
(왼쪽부터) 연세대 생명공학과 이인석 교수, 김정연 박사과정생
연세대학교(총장 윤동섭) 생명공학과 이인석 교수 연구팀은 배양이 어려운 미생물의 유전체를 메타지놈 데이터로부터 정확하게 복원하는 최적의 분석 전략을 제시했다. 이번 연구는 최근 빠르게 발전하고 있는 인공지능 기반 메타지놈 분석 도구들을 포함한 최신 기술들을 대규모로 비교해, 조건마다의 최적의 방법을 체계적으로 검증했다는 점에서 의미가 크다.
마이크로바이옴 연구의 핵심 과제 중 하나는 사람의 장, 구강, 그리고 다양한 환경에 존재하는 수많은 미생물 가운데 실험실에서 배양하기 어려운 미생물의 유전체를 직접 해독하고 재구성하는 것이다. 이러한 유전체 정보는 미생물이 어떤 기능을 하는지, 숙주 건강이나 질환과 어떤 관련이 있는지, 그리고 미생물 생태계 안에서 어떤 역할을 하는지를 이해하는 데 필수적이다. 그러나 실제 메타지놈 데이터는 매우 복잡하고, 서로 다른 미생물의 DNA 조각이 뒤섞여 있어 이를 정확히 분리하고 복원하는 과정이 어렵다.
최근에는 딥러닝과 신경망 기반 알고리즘을 포함한 인공지능 기술이 메타지놈 분석에도 빠르게 도입되고 있다. 그러나 새로운 도구들이 잇따라 개발되는 데 비해, 각각의 성능을 동일한 기준 아래에서 체계적으로 비교하고 실제 연구에 어떤 전략이 가장 적합한지를 보여주는 연구는 부족했다.
연구팀은 이러한 문제를 해결하기 위해, 최신 메타지놈 유전체 복원 도구들을 대규모로 비교하는 통합 벤치마킹 연구를 수행했다. 연구팀은 9개의 대표적 분석 도구와 3개의 후처리 전략을 대상으로, 모의 데이터와 실제 메타지놈 데이터를 함께 분석해 성능을 검증했다. 특히 시퀀싱 깊이, 미생물 군집의 복잡도, 샘플 수, 시퀀싱 방식 등 실제 연구 결과에 큰 영향을 주는 다양한 조건을 함께 고려했다.
그 결과, 인공지능 기반 최신 도구들이 기존 전통적 방법들보다 전반적으로 더 우수한 성능을 보였으며, 특히 미생물 군집이 매우 복잡하거나 시퀀싱 데이터가 충분하지 않은 조건에서 강점을 나타냈다. 이는 마이크로바이옴 연구에서 인공지능 기술이 난도가 높은 데이터 해석 문제를 해결하는 데 실질적으로 기여할 수 있음을 보여준다.
연구팀은 기존 비교 연구에서 상대적으로 충분히 평가되지 않았던 잘못 이어 붙여진 유전체 조각 문제까지 함께 분석했다. 그 결과, 단순히 더 많은 미생물 유전체를 복원하는 것만으로는 충분하지 않으며, 얼마나 정확하고 신뢰도 높게 복원했는지가 매우 중요하다는 점을 밝혔다. 이는 향후 마이크로바이옴 유전체 카탈로그 구축의 품질 기준을 높이는 데 중요한 근거가 될 것으로 기대된다.
아울러 연구팀은 여러 샘플을 동시에 활용하는 전략의 최적 조건을 제시했다. 여러 샘플을 함께 분석하는 방법은 일반적으로 성능 향상에 도움이 됐지만, 그 효과는 무한정 증가하지 않았으며 약 20개 안팎의 샘플을 활용할 때 가장 효율적이었다. 또한 paired-end sequencing이 유전체 복원 정확도를 뚜렷하게 높였고, 반대로 single-end sequencing은 어떤 도구를 사용하더라도 결과 품질을 크게 떨어뜨리는 것으로 나타났다.
최종적으로 연구팀은 여러 최신 분석 도구의 장점을 결합한 최적 통합 파이프라인을 제안했다. 이 전략은 기존 방식들보다 더 많은 미생물 유전체를 복원했을 뿐 아니라, 더 다양한 미생물 계통을 포괄해 장내, 구강, 환경 마이크로바이옴 등 다양한 생태계에서 일관되게 우수한 성능을 보였다.
이인석 교수는 “마이크로바이옴 연구에서 가장 중요한 일 중 하나는 배양이 어려운 미생물들의 유전체를 정확히 복원하는 것”이라며 “이번 연구는 최근 주목받는 인공지능 기반 분석 기술들이 실제로 어느 조건에서 강점을 가지는지 객관적으로 검증하고, 연구자들이 가장 효과적인 전략을 선택할 수 있도록 실용적인 가이드를 제시했다”라고 말했다.
이어 “이번 성과는 단순한 도구 비교를 넘어, 앞으로 더 정밀한 마이크로바이옴 유전체 지도 구축과 질환 연관 미생물 연구, 나아가 차세대 인공지능 기반 미생물 분석 기술 개발의 기반이 될 것”이라고 밝혔다.
이번 연구는 한국연구재단 중견연구자지원사업과 구강마이크로바이옴 연구센터(K-OMRC), 연세대학교 바이오센테니얼융합연구원(BCCI)의 지원으로 수행됐으며, 연구 결과는 ‘네이처 커뮤니케이션스지(Nature Communications)’에 4월 14일 온라인 게재됐다. 연구에는 생명공학과 김정연 박사과정생이 제1 저자로 참여했다.



댓글목록 0