본문내용 바로가기 메인메뉴 바로가기

CSR

HOME CSRWebzine

Webzine

Web database DAPC와 PCA 알아보기
  • Date 2021-02-03

 

 

유전적 다양성 및 집단 구조 분석 1

DAPC와 PCA 알아보기 

 

PCA(Principal components anlaysis)는 연구자 분들이 그룹간 유전적 구조를 확인하는 유용한 방법론으로 연구에 많이 활용하고 있습니다. 그런데 2010년 이후로 DAPC (Discriminant Analysis of Principal Components)는 보다 세밀한 정보를 주면서 유전구조 분석에 더욱 활발히 활용되고 있는 추세입니다.

 

왜 GBS 분석과 함께 DAPC 분석을 하는 사례가 늘고 있는 걸까요?

 

 GBS 분석에 의뢰가 많아, 이미 씨더스는 국내 자원의 50여종 이상의 분석 사례를 경험하였습니다. GBS 유전자원 구조 분석에 주로 요청하신 연구 결과의 방법론은 STRUCTURE, BAPS와 같은 Bayesian clustering 방법으로, 모집단 구성을 추론하는 방법 입니다. 그러나 이러한 모델 기반의 방법은 특히 대규모 데이터를 분석할 때 많은 수의 매개 변수를 추정하는데 상당한 계산 시간이 필요하다는 단점이 있습니다. 이를 보완하기 위해 PCA 분석을 많이 추천 드렸습니다.

 그런데 왜 ? 최근 들어 ”DAPC 분석을 PCA와 함께 볼 수 있을까요?”라는 질문을 많이 하시는 걸까요?

차근히 분석을 수행해 본 결과, DAPC는 multivariate method로 1단계로 PCA 분석을 실시하고, 2단계로 클러스터를 구분하는 DA 분석을 실시하여 집단이 본연이 가지고 있는 클러스터 간 혹은 클러스터 내에 존재하는 상호관계를 디테일하게 확인 할 수 있기 때문에 분석의 깊이가 훨씬 깊어진다는 결론을 얻었습니다. 그렇다면 PCA와 DAPC 분석을 통해 어떻게 표현되는지 예를 통해 알아볼까요?

 

 

PCA & DAPC scatterplot 예시


 

PCA, DAPC, STRUCTURE의 결과를 동시에 비교하면 보다 명확한 해석이 가능합니다! 

 


 

Top