초록 close

본 논문에서는 마이크로어레이 행렬자료에서 두 조직표본 계급에 걸쳐 대상 질환에 대해 유의적으로 상이발현 하는 양성 유전자집단과 음성 유전자 집단 및 그렇지 않은 비상이 발현 유전자 집단의 군집을 유도함에 있어 성분-평균에 선형계획을 도입한 정규혼합모형을 이용하였다. 특히 본 논문에서 강조한 점은 두 상이발현 유전자 군집에서 계급에 걸쳐 폴드 변이가 일정한 수준이 되도록 제약식을 두어 상이발현 유전자 집단이 보다 뚜렷한 정보를 가진 유전자들로 이루어지도록 한 것이다. 또한 상이 패턴 혹은 비상이 패턴 외에 특성을 가지는 유전자를 또 하나의 군집으로 흡수하기 위해 균등분포를 혼합모형의 성분으로 추가하였다. 이 과정에서 EM 알고리즘을 이용한 모형 적합을 유도하였다. 그리고 Alon의 대장암 마이크로어레이 발현자료를 사용하여 거짓양성 유전자에 관련하여 제안된 군집기법의 유효성을 실험하였다.


In this paper, a mixture model based method for gene clustering in microarray data with linear restriction by the magnitude of fold-change is proposed in order to lead genes into differentially 'positive', 'negative' and 'null' gene cluster. Also this mixture model includes the uniform distribution as a component for the purpose of absorbing the so called 'extra pattern genes'.Fitting of this mixture model is developed via EM algorithm. And using Alon's colon tumor expression data the proposed clustering method is experimented along with the false positive genes to show its effectiveness.