Contrôle de QoS
QoS (Quality of Service) est conçu pour réagir au fonctionnement général d'un serveur Domino® afin de le maintenir en service et de garantir une exécution fiable à tout moment. Si QoS détecte qu'un serveur ne répond pas ou est arrêté, l'analyse QoS peut être configurée pour envoyer un courrier électronique à un administrateur pour lui signaler le problème et/ou fermer le serveur, puis le redémarrer. Les informations du journal QoS peuvent être utiles pour l'analyse du support technique.
Pourquoi et quand exécuter cette tâche
QoS requiert l'exécution du serveur Domino® avec le contrôleur Java exécuté via la console Java.
qosprobe
peut être configurée avec les paramètres suivants dans le fichier NOTES.INI du serveur Domino® : QOS_PROBE_INTERVAL=n
Intervalle d'analyse en minutes. Ce paramètre peut être défini dans notes.ini. La valeur par défaut est de 1 minute.
QOS_PROBE_TIMEOUT=n
Délai d'attente de l'analyse, en minutes. Ce paramètre peut être défini dans dcontroller.ini. La valeur par défaut est de 5 minutes.
QOS_PROBE_TIMEOUT
doit être supérieur à QOS_PROBE_INTERVAL
. Si le délai de réponse de l'analyse dépasse le délai d'attente, le serveur est constamment redémarré.qosprobe
transmet ses résultats d'analyse. (SUCCESS, ERROR, TIMEOUT). Les messages sont capturés dans le fichier qosctnrlrtimestamp.out du répertoire de données du serveur. Le message suivant est un exemple de message de réussite (SUCCESS) : 2010/01/07 07:42:56 QoS Probe: SUCCESS (88ms)
Voici un exemple de message d'erreur :2010/01/07 08:05:59 QoS Probe: ERROR: ProbeError=4803
- Les appels
NSFDbOpen
ouNIFOpenCollection
utilisés par l'analyse renvoient une erreur Domino ERR_TIMEOUT. Cette erreur est envoyée au contrôleur et un arrêt/redémarrage est lancée. Le contrôleur ne reçoit pas de message de qosprobe au cours du délai d'attente (QOS_PROBE_TIMEOUT
). Cela peut se produire de l'une des manières suivantes : qosprobe a été arrêté ('tell qosprobe quit
') ou n'est pas en cours d'exécution.qosprobe
se bloque lors de l'analyse.
Si le contrôleur est informé du dépassement du délai d'attente de l'analyse, il est possible qu'il ne lance pas la procédure d'arrêt/redémarrage du serveur car des opérations lourdes ou à exécution longue sont en cours d'exécution (et peut-être à l'origine du dépassement du délai d'attente de la sonde). Ces opérations incluent BACKUP, COMPACT, DBCOPY, FIXUP et DBPURGE. Dans ces cas, les messages suivants peuvent être consignés dans le fichierqoscntrlrtimestamp.out :
2010/01/07 07:42:56 QoS Controller: The controller has received a probe timeout.
2010/01/07 07:42:56 QoS Controller: There are long running applications - probing will pause until they have completed.
Si cette situation est détectée, le contrôleur accorde aux opérations longues plus de temps pour s'exécuter. Si une opération longue ne parvient pas à s'exécuter dans le délai imparti, le contrôleur lance une procédure d'arrêt/redémarrage. Un message comparable à celui indiqué ci-dessous est consigné dans le fichier qoscntrlrtimestamp.out :
2010/01/07 07:42:56 QoS Controller: Applications are not making progress.
QOS_PROBE_INTERVAL
QOS_PROBE_TIMEOUT
QOS_RESTART_LIMIT_PERIOD
QOS_SHUTDOWN_TIMEOUT
QOS_RESTART_TIMEOUT
QOS_APPS_TIMEOUT