Connecteur de réindexation complète

Cette rubrique décrit le flux de données du connecteur NiFi par défaut utilisé pour la réindexation complète de l'index de recherche Elasticsearch.

HCL Commerce Version 9.1.10.0 or later

Flux de données du connecteur de réindexation complète

Le connecteur de réindexation génère à nouveau l'index de recherche Elasticsearch. Cet index se compose des indices Magasin, Catalogue, Catégorie, Attribut, Produit, URL et Prix. Le processus d'indexation commence par la création d'un schéma, de la base de données de produits et de STA. Les données sont chargées en explorant progressivement le catalogue, puis la catégorie. Ensuite, la boucle de flux principale prend le relais, en traitant les attributs, les produits, les URL de référencement et, enfin, à partir de cette boucle, le prix

Le diagramme suivant illustre ce flux de données à partir de HCL Commerce version 9.1.10. Le flux se compose de quatre étapes principales, chacune contenant des sous-étapes qui peuvent se répéter. Chaque étape est décrite plus en détail dans Tableau 1..

L'étape Traitement en arrière-plan améliore la pertinence de la recherche de chacun des documents du produit. Elle n'affecte pas la vitrine. Une fois que l'index de recherche devient actif, le magasin devient opérationnel.
Note: Les relations NLP et matchmaker, telles que la mise en correspondance des couleurs, ne dépendent pas de la finalisation de l'index pour être utilisables. Elles sont générées séparément et en parallèle par rapport à l'index et complètent son contenu une fois qu'elles sont terminées.
Table 1. Tableau 1.

Connecteur de réindexation complète

Etapes de flux de données de pipeline et noms de canal/flux

BOUCLE DE LANGUE
SCHEMA STA STORE CATALOGAGE CATEGORY ATTRIBUTE PRODUIT URL de référencement PRIX.TITRE FORMATION
Magasin 1

StoreSchema2

Zookeeper

DatabaseSTAZookeeperStage1

Royaume-Uni

DatabaseStoreStage1

1a (Document principal)

DatabaseCatalogStage1a

1a (Document principal)

DatabaseCategoryStage1a

1a (Document principal)

DatabaseAttributeStage1a

1a (Document principal)

DatabaseProductStage1a

1a (URL de catégorie)

DatabaseURLStage1a

1a (Rechercher les prix du produit)

DatabasePriceStage1a

Etape de catégorie 1c (descriptions longues)

DatabaseCategoryStage1c

Catalogue

CatalogSchema

Mot neutre synonyme

LoadSTASynonymsStopwordStage1

1b (Rechercher des filtres)

DatabaseCatalogStage1b

1b (Rechercher des facettes)

DatabaseCategoryStage1b

1b (Rechercher des valeurs d'attribut)

DatabaseAttributeStage1b

1b (Document enrichi)

DatabaseProductStage1b

1b (URL du produit)

DatabaseURLStage1b

1b (Rechercher des prix du groupement)

DatabasePriceStage1b

Etape de produit 1g (Longues descriptions)

DatabaseProductStage1g

Attribut

AttributeSchema

1d (Hiérarchie de génération)

DatabaseCategoryStage1d

1h (Rechercher des éléments enfant)

DatabaseProductStage1h

1c (Type de page)

DatabaseURLStage1c

2 (Copier dans le produit)

CopyLink

NLP enrichi

NLPStage1

URL

URLSchema

1e (Rechercher les facettes masquées)

DatabaseCategoryStage1e

1i (Rechercher une catégorie parent)

DatabaseProductStage1i

1d (Rétromigration d'URL de catégorie)

DatabaseURLStage1d

SplitLink – Stock

(Lance un connecteur de stock distinct :)

Catégorie

CategorySchema

1e (Rechercher des attributions)

DatabaseProductStage1e

1e (Rétromigration de l'URL du produit)

DatabaseURLStage1e

Etape de stock 1a (Inventaires parent)

DatabaseInventoryStage1a

Produit

ProductSchema

1f (URL de contenu)

DatabaseURLStage1f

Etape de stock 1b (Stocks enfant)

DatabaseInventoryStage1b

Description

DescriptionSchema

Etape de stock 2 (Copier vers le produit)

InventoryStage2

Prix

PriceSchema

Stockage

InventorySchema

Espace de travail

WorkspaceSchema

1 Libellé du groupe de processus

2 Nom du canal / Nom du flux (utilisez les noms de flux dans NiFi pour rechercher des groupes de processus spécifiques dans une étape donnée)

Ce connecteur utilise les schémas suivants.

HCL Commerce Version 9.1.12.0 or later

Réindexation d'eSite par rapport au magasin de ressources de catalogue

Comme décrit dans Choix de votre modèle d'index, HCL Commerce Search version 9.1.12 introduit une alternative au modèle d'indexation d'eSite préexistant. Dans ce modèle, la réindexation pour les magasins eSite utilise le flux de processus décrit dans Flux de données du connecteur de réindexation complète. En se concentrant sur les flux principaux et secondaires, les processus sont exécutés dans l'ordre suivant :

Chaque flux de traitement ne peut prendre en charge qu'un seul magasin et une langue à la fois. Un composant de contrôle de flux est utilisé pour effectuer des flux de données internes récurrents afin de gérer d'autres langues prises en charge. Les URL de référencement et d'autres métadonnées associées sont indexées dans un index d'URL distinct pour la recherche du temps de requête.

En revanche, l'approche d'indexation de magasin de ressources de catalogue (CAS) traite tous les sites étendus sous-jacents et leurs langues prises en charge dans un seul flux de données. Les étapes de traitement sont très similaires au modèle eSite, sauf que l'étape de l'URL est remplacée par une étape Page qui indexe uniquement les modèles de référencement associés à chaque mot clé. Les URL de référencement et les métadonnées ne sont plus indexées et sont calculées et mis en cache au moment de la requête. Le flux de processus obtenu est indiqué dans le diagramme suivant.

Pour plus d'informations sur le flux d'indexation dans le modèle d'indexation CAS, voir Fonctions d'index du magasin de ressources catalogue.