Récupération d'un index de recherche corrompu après un échec inattendu
Vous pouvez récupérer un index de recherche corrompu, défaillant, endommagé ou inaccessible si une défaillance matérielle ou logicielle inattendue se produit.
- Une tâche d'indexation a été interrompue, ce qui a entraîné la réplication d'un index partiellement généré en production.
- Une perte de connectivité réseau pendant la réplication de l'index, entraînant la corruption d'un ou de plusieurs fichiers de segments de données d'index.
- Manque de descripteurs de fichiers ou de capacité de stockage lors de l'indexation ou de la réplication, entraînant la suppression de l'index entier.
Pour déterminer ce qu'il faut sauvegarder et restaurer en cas de corruption d'index, vous devez comprendre quels composants sont impliqués et comment les données circulent dans chaque composant. Un répéteur est généralement utilisé dans un environnement de production pour effectuer l'indexation, lors de laquelle les données de catalogue sont lues directement à partir de la base de données de production. Une fois que le répéteur a terminé l'indexation, les membres du cluster des serveurs subordonnés de recherche extraient les modifications du répéteur et répliquent localement la mise à jour sur chaque serveur subordonné. Une copie locale de l'index existe sur chaque serveur subordonné à l'emplacement solrhome. La page d'accueil Solr contient tous les fichiers liés au serveur de recherche. Par conséquent, il est important que votre stratégie de sauvegarde copie toutes les informations sous la page d'accueil Solr du répéteur. C'est-à-dire la copie principale de l'index en production.
Si des problèmes d'index se produisent dans le système de production, l'index corrompu peut être restauré à partir d'une sauvegarde ou regénéré. Il est recommandé de configurer une tâche récurrente pour copier vos index vers un autre emplacement de stockage à un intervalle régulier, ou juste avant chaque réindexation. Cette pratique réduit considérablement le temps de restauration de l'index. Par exemple, si un index est corrompu, vous pouvez restaurer la version de travail la plus récente connue de l'index de recherche sur le répéteur et la définir comme l'index actuel. Les serveurs subordonnés pourront automatiquement se synchroniser avec la version d'index restaurée.
En général, il est fortement recommandé de conserver au moins une copie de l'index de recherche de travail le plus récent. Cette copie de sauvegarde doit être tenue à jour et actualisée chaque fois qu'une modification est apportée à l'index de recherche. Ensuite, en cas d'échec d'un index ou de corruption, la restauration de la sauvegarde récente est rapide et efficace pour remettre le site en marche. Une sauvegarde d'index est simplement une copie des fichiers de données d'index sur le système de fichiers. Le meilleur moment pour créer une sauvegarde est juste après que l'indexation finale est terminée, et qu'un test rapide d'intégrité et d'évaluation est effectué. Conserver plusieurs sauvegardes successives, afin de bénéficier de plus de flexibilité lorsque vous revenez à une version antérieure de l'index de recherche, est facultatif mais bénéfique.
Pour restaurer l'index de recherche à une version antérieure, effectuez la tâche suivante : Sauvegarde d'un index HCL Commerce Search. Même si les données indexées de la sauvegarde sélectionnée peuvent être légèrement obsolètes, le site peut être restauré avec un temps d'arrêt minimal. Alors que le site est à nouveau opérationnel et s'exécute depuis la sauvegarde restaurée, vous pouvez étudier la cause profonde et effectuer des plans de récupération supplémentaires, comme réessayer de générer l'index de recherche corrompu sur le même serveur d'indexation ou sur un autre.
Procédure
-
Sauvegardez la page d'accueil Solr, afin que vous puissiez capturer un environnement de recherche de travail, y compris les index de recherche.
Déterminez les emplacements de la page d'accueil Solr que vous souhaitez sauvegarder, en fonction de votre environnement :
Option Description Environnement de transfert - Lors de l'indexation avec la propagation de transfert, les utilisateurs professionnels appliquent des modifications à une zone de transfert, qui est ensuite propagée dans l'environnement de production par les administrateurs informatiques. Un répéteur d'index est utilisé pour capturer le contenu de l'index le plus récemment déployé, tout en servant de sauvegarde.
Sauvegardez le répertoire de la page d'accueil de l'index Solr.
Déterminez le calendrier de sauvegarde en fonction du moment où les utilisateurs professionnels n'effectuent pas de modifications complètes à propager dans la production.
-
Vérifiez les index de recherche problématiques en exécutant l'outil CheckIndex.
CheckIndex est un outil disponible dans la bibliothèque Lucene. Il vérifie les fichiers et crée de nouveaux segments qui ne contiennent pas d'entrées problématiques. Fonction facultative, l'outil CheckIndex est capable de réparer un index cassé avec peu de perte de données. Ainsi, vous n'avez pas à restaurer l'index à partir d'une sauvegarde, ou à effectuer une indexation complète de tous les documents stockés dans Solr.
-
Si vous pouvez identifier un index de recherche problématique, vous pouvez sauvegarder et restaurer les index de recherche depuis des instantanés.
Pour ce faire, suivez les étapes dans Sauvegarde d'un index HCL Commerce Search.
- Pour les index de recherche problématiques, restaurez le répertoire de la page d'accueil Solr sauvegardé sur la zone problématique.