Suivi de la qualité de service
La qualité de service, ou QoS, est conçue pour réagir au fonctionnement général d'un serveur Domino ® afin de maintenir ce serveur en fonctionnement fiable et toujours disponible. Si QoS détecte qu'un serveur ne répond pas ou est bloqué, la vérification QoS peut être configurée pour envoyer un e-mail à un administrateur concernant le problème et/ou arrêter automatiquement le serveur et le redémarrer. Les informations du journal QoS peuvent également être utiles pour l’analyse par le support.
À propos de cette tâche
QoS nécessite que le serveur Domino ® soit exécuté sous le contrôleur Java à l'aide de la console Java.
qosprobe
La tâche complémentaire peut être configurée avec les paramètres suivants sur le serveur Domino ® dans le fichier NOTES.INI du serveur :
QOS_PROBE_INTERVAL=n
L'intervalle de sonde en minutes. Cela peut être défini dans le notes.ini . La valeur par défaut est 1 minute.
QOS_PROBE_TIMEOUT=n
Le délai d'expiration de la sonde en minutes. Cela peut être défini dans le dcontroller.ini . La valeur par défaut est de 5 minutes.
QOS_PROBE_TIMEOUT
devrait être beaucoup plus grand que QOS_PROBE_INTERVAL
. If the timeout
occurs before the probe is set to respond, the server will be restarted
constantly.qosprobe
le module complémentaire communique ses résultats de sondage. (SUCCÈS, ERREUR, DÉLAI D'ATTENTE). Les messages sont capturés dans le fichier qosctnrlrtimestamp.out trouvé dans le répertoire de données du serveur. Voici un exemple de message de SUCCÈS : 2010/01/07 07:42:56 QoS Probe: SUCCESS (88ms)
Voici un exemple de message d’erreur :2010/01/07 08:05:59 QoS Probe: ERROR: ProbeError=4803
- Le
NSFDbOpen
ouNIFOpenCollection
les appels utilisés par la sonde renvoient l'erreur ERR_TIMEOUT de Domino. Cette erreur est envoyée au contrôleur et un arrêt/redémarrage intelligent est lancé. Le contrôleur ne reçoit pas de message de qosprobe dans le délai imparti (QOS_PROBE_TIMEOUT
). This can happen in one of the following ways: qosprobe was told to quit ('tell qosprobe quit
') ou n'est pas en cours d'exécution.qosprobe
se bloque pendant le sondage.
Si le contrôleur reçoit un dépassement de délai de sonde, il se peut qu'il ne lance pas une suppression/un redémarrage du serveur car des opérations de longue durée et/ou à charge intensive sont en cours d'exécution (et peuvent donc avoir provoqué l'expiration du délai de sonde). Ces opérations incluent BACKUP, COMPACT, DBCOPY, FIXUP et DBPURGE. Dans ces cas, vous voyez des messages comme ceux-ci dans le fichier qoscntrlrtimestamp.out :
2010/01/07 07:42:56 QoS Controller: The controller has received a probe timeout.
2010/01/07 07:42:56 QoS Controller: There are long running applications - probing will pause until they have completed.
Si cette condition est détectée, le contrôleur accordera alors à l'opération longue (« de longue durée ») plus de temps pour se terminer. Si une opération longue ne parvient pas à se terminer dans ce laps de temps, le contrôleur procédera alors à l'arrêt/redémarrage intelligent. Vous voyez un message comme celui de l'exemple suivant dans le fichier qoscntrlrtimestamp.out :
2010/01/07 07:42:56 QoS Controller: Applications are not making progress.
QOS_PROBE_INTERVAL
QOS_PROBE_TIMEOUT
QOS_RESTART_LIMIT_PERIOD
QOS_SHUTDOWN_TIMEOUT
QOS_RESTART_TIMEOUT
QOS_APPS_TIMEOUT