美 연구진 “2019년 12월 코로나 첫 발병 이전 중국 우한서 이미 바이러스 전파 가능성”

2021.06.24 17:15
코로나19 기원 논란 가열
중국 후베이성 우한(武漢)시의 화난(華南)수산물도매시장 입구. 연합뉴스 제공
중국 후베이성 우한(武漢)시의 화난(華南)수산물도매시장 입구. 연합뉴스 제공

신종 코로나바이러스 감염증(COVID-19·코로나19) 진원지로 알려진 중국 우한 초기 발병 사례에서 추출한 200개 이상의 바이러스 샘플에서 얻은 유전체(게놈) 데이터가 약 1년 전 온라인 과학 데이터베이스에서 삭제됐다는 학계 보고가 나왔다.  

 

23일(현지시간) 뉴욕타임즈는 미국 시애틀 소재 프레드허친슨암연구센터 연구진이 구글 클라우드에 저장된 파일에서 이 중 13건의 게놈 데이터를 복구했다고 보도했다. 연구결과에 따르면 2019년 12월 중국 우한 수산시장에서 초기 발병한 이전에 우한에서 다양한 코로나바이러스가 이미 퍼졌을 수도 있다는 가설을 뒷받침하고 있다. 

 

연구진의 연구결과는 논문 사전공개 사이트 ‘바이오아카이브(BioRxiv)’ 22일자(현지시간)에 공개됐으며 아직 동료 과학자들의 검토를 받지는 않았다. 

 

이번 연구는 미국 바이든 대통령이 코로나19 기원 재조사를 강력히 주장하는 가운데 중국 우한 바이러스연구소에서 유출됐다는 가설과는 직접적인 관련은 없다. 그러나 연구결과가 사실이라면 당초 코로나19 바이러스 샘플 원본 게놈 데이터가 삭제된 이유에 대한 의문이 제기될 수밖에 없는 상황이다. 코로나19 기원과 관련된 논란이 삭제된 게놈 데이터를 둘러싸고 새로운 국면을 맞을 가능성도 배제하기 어렵다. 

 

연구를 주도한 제시 블룸 프레드허친슨암연구센터 바이러스학자는 “초기 바이러스 샘플 게놈 데이터가 삭제된 사실이 의심스럽다”고 밝혔다. 뉴욕타임즈 보도에 따르면 그는 지난 5월 “우한 실험실에서 코로나19 바이러스가 유출돼 확산됐을 가능성이 높은지, 아니면 실험실과는 관계없이 감염된 동물과 인간이 접촉해 확산됐는지를 판단할 정보가 충분하지 않다”고 밝혔다. 

 

코로나19 감염 초기 사례에서 얻은 바이러스 샘플의 게놈 데이터는 기존에 알려진 것처럼 박쥐와 같은 동물에서 인간으로 이동했는지 여부를 밝히는 데 중요한 단서가 될 수 있다는 점에서 발병 초기 삭제된 게놈 데이터에 관한 이번 연구는 관심을 모은다. 

 

블룸 박사는 여러 연구그룹에서 발표한 바이러스 관련 유전 데이터를 검토하다가 중국 우한 소재 과학자들이 수집한 241개의 게놈 정보를 담은 스프레드시트가 포함된 2020년 3월 연구를 발견했다. 이 스프레드시트는 과학자들이 미국 국립의학도서관에서 관리하는 ‘시퀀스 리드 아카이브(Sequence Read Archive)’라는 온라인 데이터베이스에 업로드했다는 증거를 나타낸다. 

 

그러나 블룸 박사가 이달 초 바이러스 관련 게놈 시퀀싱 데이터베이스에서 중국 우한 데이터를 찾았을 때 ‘항목을 찾을 수 없음’이라는 결과가 노출됐다. 당황한 그는 추가 단서를 찾기 위해 스프레드시트를 확인했고 스프레드시트에 포함된 241건의 게놈 데이터가 중국 우한인민병원 과학자가 수집한 것으로 나타났다. 의학 문헌을 검색하고 2020년 3월 이들 중국 연구진이 온라인에 공개한 코로나19에 관한 새로운 실험 테스트를 설명하는 또다른 연구를 발견했다. 중국 연구진들은 3개월 후 이를 과학저널에 발표했다. 

 

이 연구에서 중국 과학자들은 “유행 초기에 코로나19로 의심되는 외래 환자한테 채취한 45개의 샘플을 조사했다”고 쓴 것으로 나타났다. 이 과학자들은 샘플에서 추출한 유전체 시퀀싱 데이터를 발표하지는 않았고 대신 바이러스의 일부 변이만 발표했다. 

 

하지만 블룸 박사는 중국 과학자들이 보고한 샘플이 241개의 누락된 게놈 데이터의 근원이라는 여러 단서를 찾아냈다고 밝혔다. 중국 과학자들의 논문에는 ‘시퀀스 리드 아카이브’에 게놈 데이터가 업로드된 이유에 대한 설명이 없었고 나중에 데이터도 사라진 것으로 나타났다. 

 

시퀀스 리드 아카이브를 자세히 살펴본 블룸 박사는 상당수 데이터가 구글 클라우드 파일에 저장됐다는 사실을 알아냈다. 각 게놈 시퀀싱 데이터는 클라우드 파일에 포함돼 있으며 파일 이름은 모두 동일한 기본 형식을 공유하고 있었던 것으로 확인됐고 블룸 박사는 누락된 게놈 시퀀싱 데이터 13건을 찾아내 복구하는 데 성공했다. 

 

블룸 박사는 이 데이터를 감염병 초기 단계 코로나19 바이러스 게놈 시퀀싱 데이터와 결합했다. 초기 샘플 데이터 중 일부는 2019년 12월에 발병한 중국 우한 화난수산시장에서 가져온 것이다. 분석 결과 복구된 데이터에는 실제 몇 주 후에 수집된 샘플 데이터에는 없는 3건의 추가 변이를 포함하고 있었다. 이는 곧 화난수산시장을 거치지 않은 바이러스 초기 혈통이 이미 존재했다는 사실을 의미한다. 화난수산시장이 진원지가 아닐 수도 있다는 의미다. 이와 관련 블룸 박사는 “코로나19 바이러스의 염기서열 데이터 심층 분석을 통한 확인 과정이 필요하다”고 언급했다. 

 

삭제된 데이터가 어떤 이유로 삭제됐는지는 분명하지 않다는 분석이다. 시퀀스 리드 아카이브 관리자에게 연구자가 파일 삭제를 요청할 수 있기 때문이다. 아카이브 관리자는 지난해 여름 13건의 데이터가 삭제됐다고 밝혔다. 13건의 누락된 게놈 시퀀싱 데이터를 생성한 3명의 과학자들의 블룸 박사의 발견에 대해 문의하는 이메일에 답하진 않은 것으로 알려졌다. 
 

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150