서비스 품질 모니터링

서비스 품질, 즉 QoS는 Domino® 서버의 일반적인 운영에 대응하여 해당 서버가 안정적으로 작동하고 항상 사용 가능한 상태를 유지할 수 있도록 설계되었습니다. QoS가 서버가 응답하지 않거나 중단된 것을 감지하면 관리자에게 문제에 대해 이메일을 보내거나 자동으로 서버를 종료하고 다시 시작하도록 QoS 검색을 구성할 수 있습니다. QoS 로그 정보는 지원팀의 분석에도 유용할 수 있습니다.

이 작업 정보

주의: QoS와 장애 복구는 동시에 활성화해서는 안 됩니다.
중요: QoS가 server.id 파일에 비밀번호가 있는 서버를 (다시) 시작하는 경우, 관리자가 해당 서버의 콘솔에 연결하여 비밀번호를 입력할 때까지 서버가 시작되지 않습니다. 따라서 관리자가 수동으로 비밀번호를 입력할 수 없는 불편한 시간에 특정 서버에서 아무런 개입 없이 Domino를 (다시) 시작할 수 있는 QoS가 필요한 경우 해당 서버의 server.id 파일에 비밀번호를 사용하지 마세요.

QoS를 사용하려면 Domino® 서버가 Java 콘솔을 사용하여 Java 컨트롤러에서 실행되어야 합니다.

그만큼 qosprobe 추가 기능 작업은 Domino ® 서버의 서버 NOTES.INI 파일에서 다음 설정으로 구성할 수 있습니다.
  • QOS_PROBE_INTERVAL=n

    프로브 간격(분)입니다. 이는 notes.ini 에서 설정할 수 있습니다. 기본값은 1분입니다.

  • QOS_PROBE_TIMEOUT=n

    프로브 시간 초과(분)입니다. 이는 dcontroller.ini 에서 설정할 수 있습니다. 기본값은 5분입니다.

팁: QOS_PROBE_TIMEOUT 훨씬 더 커야 합니다 QOS_PROBE_INTERVAL. If the timeout occurs before the probe is set to respond, the server will be restarted constantly.
서버 컨트롤러는 메시지 큐를 모니터링합니다. qosprobe 추가 기능이 조사 결과를 전달합니다(성공, 오류, 시간 초과). 메시지는 서버 데이터 디렉토리에 있는 qosctnrlrtimestamp.out 파일에 캡처됩니다. 다음은 SUCCESS 메시지의 예입니다.
2010/01/07 07:42:56 QoS Probe: SUCCESS (88ms)
다음은 오류 메시지의 예입니다.
2010/01/07 08:05:59 QoS Probe: ERROR: ProbeError=4803
QoS 서버가 활성화되어 있고 TIMEOUT이 발생하면 컨트롤러는 서버를 스마트하게 종료하고 다시 시작합니다. 다음 두 가지 경우에 시간 초과가 발생할 수 있습니다.
  • 그만큼 NSFDbOpen 또는 NIFOpenCollection 프로브에서 사용된 호출은 Domino의 ERR_TIMEOUT 오류를 반환합니다. 이 오류는 컨트롤러로 전송되고 스마트 킬/재시작이 시작됩니다. 컨트롤러는 시간 초과 기간 내에 qosprobe로부터 메시지를 수신하지 못합니다.QOS_PROBE_TIMEOUT). This can happen in one of the following ways: qosprobe was told to quit ('tell qosprobe quit')이거나 실행 중이 아닙니다. qosprobe 탐색하는 동안 걸려 있습니다.

컨트롤러가 프로브 시간 초과를 수신하는 경우, 장시간 실행되거나 부하가 많은 작업이 실행 중이기 때문에(따라서 프로브 시간 초과가 발생했을 수 있음) 서버 종료/재시작을 시작하지 못할 수 있습니다. 이러한 작업에는 BACKUP, COMPACT, DBCOPY, FIXUP 및 DBPURGE가 포함됩니다. 이런 경우 qoscntrlrtimestamp.out 파일에서 다음과 같은 메시지가 표시됩니다.

2010/01/07 07:42:56 QoS Controller: The controller has received a probe timeout.
2010/01/07 07:42:56 QoS Controller: There are long running applications - probing will pause until they have completed.

이러한 조건이 감지되면 컨트롤러는 시간이 오래 걸리는("장기 실행") 작업을 완료하는 데 더 많은 시간을 허용합니다. 해당 시간 내에 긴 작업이 완료되지 못하면 컨트롤러는 스마트 킬/재시작을 진행합니다. 다음 예와 같은 메시지가 qoscntrlrtimestamp.out 파일에 표시됩니다.

2010/01/07 07:42:56 QoS Controller: Applications are not making progress.
중요: 다음 여섯 가지 NOTES.INI 값에 대해 값을 구성하지 않거나 기본값보다 작게 구성하면 기본값이 적용됩니다. 기본값보다 큰 값으로만 변경할 수 있습니다.
  • QOS_PROBE_INTERVAL
  • QOS_PROBE_TIMEOUT
  • QOS_RESTART_LIMIT_PERIOD
  • QOS_SHUTDOWN_TIMEOUT
  • QOS_RESTART_TIMEOUT
  • QOS_APPS_TIMEOUT

절차

다음 작업을 수행합니다.