초록 close

분산 시스템에 결함 내성 기능을 제공하는 기법의 하나인, 검사점을 이용한 회복 기법을 효율적으로 구현하기 위해서는 최적화 된 검사점 설정 구간의 선택이 매우 중요한 문제로 인식되고 있다. 본 논문은 분산 시스템내의 각 프로세스가 적절한 검사점 설정 구간을 프로세스의 연산 중에 동적으로 스케쥴링 하는 기법을 제안한다. 제안된 기법에서는 시스템내의 각 프로세스가 현 검사점 구간 동안의 검사점 설정 비용과 가능한 롤백 회복 비용을 비교 평가하고, 다음 검사점 설정을 위한 적절한 구간을 계산한다. 대부분의 기존 기법들과는 달리, 제안된 기법은 검사점과 롤백 두 가지 비용 모두를 최소화하는 구간 값을 선택하며, 현 검사점 구간 동안의 통신 형태를 고려한 구간 값을 선택한다. 또한, 검사점 설정 구간 선택을 위한 별도의 통신비용이 요구되지 않으며, 제안된 기법은 기존의 검사점 조정 기법들과 쉽게 통합되어 사용될 수 있다.


The selection of the optimal checkpointing interval has been a very critical issue to implement a checkpointing-recovery scheme for the fault tolerant distributed system. This paper presents a new scheme that allows a process to select the proper checkpointing interval dynamically. A process in the system evaluates the cost of checkpointing and possible rollback for each checkpointing interval and selects the proper time interval for the next checkpointing. Unlike the other schemes, the overhead incurred by both of the checkpointing and rollback activities are considered for the cost evaluation, and the current communication pattern is reflected in the selection of the checkpointing interval. Moreover, the proposed scheme requires no extra message communication for the checkpointing interval selection and can easily be incorporated into the existing checkpointing coordination schemes.