초록 close

일정 수준의 시스템 성능을 제공하기 위해 다수의 서버를 클러스터로 연결하여 동시에 가동할 경우, 서버의 가동 대수가 증가함으로 인해 발생하는 가용도 저하 문제를 해결해야 하며, 이를 위해서는 시스템의 성능 변화를 반영할 수 있는 가용 성능에 대한 명확한 정의가 요구된다. 기존의 가용도에 관한 연구들은 시스템의 성능(대기시간, 응답시간 등)을 고려하지 않는 가용도 계산 모델이 주를 이루고 있으며, 또한 클러스터 시스템을 구성하는 주서버의 결함 발생을 허용하기 위한 방안에 대한 연구가 부족하였다. 본 논문에서는 위와 같은 문제점들에 대한 해결 방안의 일환으로, 비용 효율적인 결함허용을 위해 n 대의 주서버와 k 대의 여분서버로 구성된 클러스터 시스템에서 대기시간을 일정 수준이하로 만족시키는지에 근거한 새로운 가용도 척도를 제시하였으며, 다양한 시스템 운영 상태에 대한 실험을 통하여, 시스템의 대기시간 데드라인 성능이 포함된 보다 현실적인 가용도 및 downtime을 계산하였다.


As cluster systems used for high performance computing consist of large number of running servers, one has to solve the low availability problems occurred by the high chance of the server failures. To handle the problems, it is necessary to have the precise definition of available performance of cluster systems that represents availability and performability of the systems simultaneously. Previous research results that mention availability issues lack for concerning system performance such as waiting time and response time in their availability definition. In this paper, we propose a new availability metric for (n,k)-way cluster systems which compose of n primary servers and k backup servers. With the metric, the change of system performance according to arrival rates is captured and the waiting time of a request can be kept below to a certain level. Using various system operating parameters, we calculate availability and downtime of cluster systems along with waiting time deadline.