암세포 발현에 관여하는 암 게놈을 저비용으로 예측하는 I모델이 개발됐다.
광주과학기술원(GIST, 총장 임기철)은 AI대학원 이현주 교수 연구팀이 서울대병원 박성혜 교수 연구팀과 공동으로 3차원 암(cancer) 게놈을 예측하는 AI 모델, ‘인포하이씨(InfoHiC)’를 개발했다고 7일 밝혔다.
연구팀은 기존 방법론과는 달리, 암세포의 전장 유전체(한 사람의 전체 유전자) 데이터를 사용했다.
이현주 교수는 “비암호화 DNA 영역의 구조 변이가 암의 발생과 진행에 미치는 영향을 종전보다 저비용으로 정확히 밝혀낼 수 있을 뿐만 아니라 암 환자에게서 직접 관찰할 수 있는 기술을 확보했다”고 말했다.
연구팀은 “암세포의 염색체에서는 복잡한 구조 변이가 빈번하게 일어나는데, ‘인포하이씨’는 이러한 복잡한 구조 변이에 의한 ‘neo-TAD’를 더 높은 정확도로 예측할 수 있다”고 설명했다.
‘TAD’는 세포 속에서 유전체가 3차원적으로 구성돼 작동하는 위상학적으로 연관된 영역을 말한다.
연구팀은 모델 학습에 사용된 데이터와는 별개의 외부 데이터인 유방암 세포주를 활용해 검증한 결과, 기존 알고리즘의 피어슨 상관계수(R) 값이 0.642이었으나, ‘인포하이씨’는 0.715로 11% 향상됐다고 밝혔다.
피어슨은 실제값과 예측값 사이의 상관관계 정도를 나타내는 지표다.
이현주 교수는 “최근 시퀀싱 데이터 비용 감소로 암 환자의 전장유전체 데이터는 많이 생산되고 있으나, 이에 반해 3차원 암 게놈을 확인할 수 있는 Hi-C 데이터는 고비용 탓에 확보가 쉽지 않다” 면서 “개인 맞춤형 암치료에 기여할 것”으로 기대했다.