Chargement d'index

Index Load est un service d'indexation qui utilise la structure Chargement des données pour charger des données en parallèle dans un ou plusieurs index d'extension de recherche.

Index Load est utilisé pour renseigner les prix des contrats lorsque des raisons de performance exigent que votre site utilise un index d'extension des prix distinct. Par exemple, utilisez Index Load avec un index d'extension de prix si votre site contient plus de 1 000 contrats, ou si vous utilisez une source externe pour renseigner les prix.

Index Load offre les avantages suivants par rapport au remplissage de l'index des entrées de catalogue avec des données sur les prix :
  • Il améliore les performances d'indexation à l'aide de la fusion locale (mode incorporé) sur le serveur de recherche pour éviter de faire des appels HTTP distants qui utilisent HTTPClient.
  • Le flux de données est diffusé directement dans une ou plusieurs colonnes d'index et aucune table temporaire n'est nécessaire. Ce modèle de programmation permet une conversion précise des données et est plus facile à personnaliser.
  • Les métriques peuvent être affichées à l'aide de la commande de statut Chargement d'index lors de l'indexation pour affiner les paramètres de réglage et améliorer le débit de performance.

Index Load utilise des profils pour contrôler le comportement d'indexation et les caractéristiques d'un index d'extension de recherche. Les profils Chargement d'index sont définis dans le fichier de configuration de Chargement d'index.

Lorsque vous appelez Index Load, vous pouvez transmettre un nom de profil via un paramètre URL nommé profil. La valeur du paramètre de profil est utilisée pour résoudre le nom de fichier réel à charger à partir du répertoire de configuration prédéfini. Le nom du modèle et le répertoire de configuration Chargement d'index sont définis comme des paramètres d'initialisation du servlet dans le web.xml du servlet Chargement d'index (SolrIndexLoadServlet).

Réglage de Chargement d'index contient des informations plus détaillées sur la façon dont les données circulent dans l'application d'indexation sur plusieurs unités d'exécution et sur les paramètres de réglage qui peuvent être utilisés.

Le diagramme suivant illustre une présentation générale de Index Load.
Aperçu Chargement d'index
Index Load contient les composants suivants :
Servlet Chargement d'index (SolrIndexLoadServlet)
L'interface Index Load. Il accepte les commandes avec des informations d'entrée telles que le profil, le catalogue et le magasin. Les informations d'entrée sont utilisées pour rechercher les fichiers de configuration spécifiés.
Interface du chargeur
Crée des unités du chargeur à exécuter en fonction de l'élément de chargement configuré (loaditem). Il n'existe qu'un seul chargeur, qui peut utiliser plusieurs articles de chargement. Chaque élément de charge comprend un lecteur, et zéro ou plusieurs médiateurs.
Article du chargeur
L'unité opérationnelle pour Index Load. Vous pouvez transmettre plusieurs articles du chargeur en parallèle, où chaque article de chargeur est une unité de charge indépendante contrôlée par un chargeur de données unique.

Au sein d'un chargeur, il existe un lecteur de données qui peut lire les données dans plusieurs unités d'exécution et des médiateurs optionnels. Les médiateurs se trouvent dans une chaîne, où la sortie d'un médiateur est l'apport d'un autre médiateur, avec un seul programme d'écriture de données. La cible de plusieurs éléments de chargement peut être la même instance de base ou des instances différentes.

Lecteur
Lit les données physiques originales provenant de sources de données en parallèle et les transmet au médiateur. SolrIndexLoadQueryReader est utilisé par défaut pour lire les données des bases de données relationnelles spécifiées par les fichiers de configuration.
Médiateur
BusinessObjectMediator définit une interface commune pour prendre l'entrée du lecteur et la transformer afin de suivre le modèle de conversion, tel que spécifié dans les fichiers de configuration. Vous pouvez fournir zéro médiateur ou plus, lorsque la sortie d'un médiateur est l'entrée du médiateur suivant. Lorsque tous les médiateurs finissent de se transformer, le programme d'écriture de données physiques conserve les objets physiques dans Solr en appelant l'interface Solrj.
Service de traitement par lots
Ajoute des documents Solr et les valide sur le serveur Solr. Un seul service par lots sert chaque noyau Solr unique, avec la possibilité d'interagir avec plusieurs programmes d'écriture d'index. Le service par lots contient une file d'attente interne pour la mise en mémoire tampon des documents inachevés depuis divers programmes d'écriture. Une fois que le document d'entrée est prêt pour l'indexation, il est envoyé au service d'exécution Solr.

Le service par lots est utilisé par défaut pour renseigner l'index d'extension de prix lors de l'indexation des prix des contrats à l'aide de Index Load.

Limitations

Tenez compte des limitations Index Load suivantes :
  • Index Load prend en charge uniquement les index d'extension. Index Load ne prend pas en charge les index Produit, Catégorie ou Non structuré.