Suivi de la qualité de service

La qualité de service, ou QoS, est conçue pour réagir au fonctionnement général d'un serveur Domino ® afin de maintenir ce serveur en fonctionnement fiable et toujours disponible. Si QoS détecte qu'un serveur ne répond pas ou est bloqué, la vérification QoS peut être configurée pour envoyer un e-mail à un administrateur concernant le problème et/ou arrêter automatiquement le serveur et le redémarrer. Les informations du journal QoS peuvent également être utiles pour l’analyse par le support.

À propos de cette tâche

ATTENTION : la qualité de service et la récupération de panne ne doivent pas être activées en même temps.
Important : si QoS (re)démarre un serveur dont le fichier server.id contient un mot de passe, le serveur ne démarrera pas tant qu'un administrateur ne se connectera pas à la console de ce serveur et n'aura pas saisi le mot de passe. Par conséquent, si vous souhaitez que QoS soit capable de (re)démarrer Domino sans intervention sur un serveur spécifique, par exemple à des moments inopportuns où un administrateur n'est pas disponible pour une saisie manuelle du mot de passe, n'utilisez pas de mot de passe sur le fichier server.id sur ce serveur.

QoS nécessite que le serveur Domino ® soit exécuté sous le contrôleur Java à l'aide de la console Java.

Le qosprobe La tâche complémentaire peut être configurée avec les paramètres suivants sur le serveur Domino ® dans le fichier NOTES.INI du serveur :
  • QOS_PROBE_INTERVAL=n

    L'intervalle de sonde en minutes. Cela peut être défini dans le notes.ini . La valeur par défaut est 1 minute.

  • QOS_PROBE_TIMEOUT=n

    Le délai d'expiration de la sonde en minutes. Cela peut être défini dans le dcontroller.ini . La valeur par défaut est de 5 minutes.

Conseil: QOS_PROBE_TIMEOUT devrait être beaucoup plus grand que QOS_PROBE_INTERVAL. If the timeout occurs before the probe is set to respond, the server will be restarted constantly.
Le contrôleur de serveur surveille une file d'attente de messages à laquelle le qosprobe le module complémentaire communique ses résultats de sondage. (SUCCÈS, ERREUR, DÉLAI D'ATTENTE). Les messages sont capturés dans le fichier qosctnrlrtimestamp.out trouvé dans le répertoire de données du serveur. Voici un exemple de message de SUCCÈS :
2010/01/07 07:42:56 QoS Probe: SUCCESS (88ms)
Voici un exemple de message d’erreur :
2010/01/07 08:05:59 QoS Probe: ERROR: ProbeError=4803
Lorsque le serveur QoS est activé, en cas de TIMEOUT, le contrôleur arrêtera automatiquement le serveur et redémarrera. Un délai d'attente peut se produire dans l'un des cas suivants :
  • Le NSFDbOpen ou NIFOpenCollection les appels utilisés par la sonde renvoient l'erreur ERR_TIMEOUT de Domino. Cette erreur est envoyée au contrôleur et un arrêt/redémarrage intelligent est lancé. Le contrôleur ne reçoit pas de message de qosprobe dans le délai imparti (QOS_PROBE_TIMEOUT). This can happen in one of the following ways: qosprobe was told to quit ('tell qosprobe quit') ou n'est pas en cours d'exécution. qosprobe se bloque pendant le sondage.

Si le contrôleur reçoit un dépassement de délai de sonde, il se peut qu'il ne lance pas une suppression/un redémarrage du serveur car des opérations de longue durée et/ou à charge intensive sont en cours d'exécution (et peuvent donc avoir provoqué l'expiration du délai de sonde). Ces opérations incluent BACKUP, COMPACT, DBCOPY, FIXUP et DBPURGE. Dans ces cas, vous voyez des messages comme ceux-ci dans le fichier qoscntrlrtimestamp.out :

2010/01/07 07:42:56 QoS Controller: The controller has received a probe timeout.
2010/01/07 07:42:56 QoS Controller: There are long running applications - probing will pause until they have completed.

Si cette condition est détectée, le contrôleur accordera alors à l'opération longue (« de longue durée ») plus de temps pour se terminer. Si une opération longue ne parvient pas à se terminer dans ce laps de temps, le contrôleur procédera alors à l'arrêt/redémarrage intelligent. Vous voyez un message comme celui de l'exemple suivant dans le fichier qoscntrlrtimestamp.out :

2010/01/07 07:42:56 QoS Controller: Applications are not making progress.
Important : pour les six valeurs NOTES.INI suivantes, si vous ne configurez pas la valeur ou la configurez comme étant inférieure à la valeur par défaut, la valeur par défaut s'applique. Vous pouvez uniquement modifier la valeur pour qu'elle soit supérieure à la valeur par défaut.
  • QOS_PROBE_INTERVAL
  • QOS_PROBE_TIMEOUT
  • QOS_RESTART_LIMIT_PERIOD
  • QOS_SHUTDOWN_TIMEOUT
  • QOS_RESTART_TIMEOUT
  • QOS_APPS_TIMEOUT

Procédure

Effectuer les tâches suivantes :