Terminologie de recherche

HCL Commerce La recherche utilise un certain nombre de termes spécialisés. Une liste concise des termes les plus couramment utilisés est fournie pour vous aider à démarrer.

Introduction à la terminologie de recherche

Les termes de recherche se réfèrent habituellement à l'un des trois composants conceptuels différents du produit : l'index, le moteur d'exécution qui traite les requêtes ou l'architecture système elle-même. Les termes les plus couramment utilisés pour chaque composant sont fournis dans ce sujet.

Termes d'indexation

Cet index est une grande table plate qui contient des zones de données optimisées pour les performances de recherche. Les chaînes de requête de recherche sont comparées aux entrées de l'index et les résultats positifs sont renvoyés au client.

Ligne/Document
Un ensemble de données qui décrit un objet de catalogue particulier. Par exemple, chaque ligne ou document du noyau CatalogEntry correspond à une entrée de catalogue spécifique.
Zone
Les lignes ou les documents du noyau sont composés de zones qui contiennent des informations spécifiques sur l'objet de catalogue. Par exemple, la zone nom est utilisée pour contenir les informations de nom de la catégorie dans une ligne (ou un document) à partir du noyau CatalogGroup.
Principale
Un index Solr qui contient des documents Solr à des fins spécifiques. Voici certains des noyaux couramment utilisés :
  • Le noyau CatalogEntry est utilisé pour stocker des données sur les entrées de catalogue dans le catalogue.
  • Le noyau CatalogGroup est utilisé pour stocker des données sur les catégories dans le catalogue.
  • Le noyau non structuré est utilisé pour stocker les données de pièce jointe pour les entrées de catalogue dans le catalogue (images, fichiers PDF et autres pièces jointes).
  • Le noyau Inventory est utilisé pour stocker les données de stock pour les entrées de catalogue dans le catalogue.
  • Le noyau Price est utilisé pour stocker les données de prix pour les entrées de catalogue dans le catalogue.
Index
L'index est composé de tous les noyaux de recherche associés à un catalogue principal. Voici certains des index courants :
  • MC_10001 est un index qui contient un noyau CatalogEntry, CatalogGroup et Unstructured.
  • MC_10101 est un index qui contient un noyau CatalogEntry, CatalogGroup, Unstructured et Inventory.
Indexation complète
Regénération de l'index entier à partir de zéro à l'aide de l'appel RESTful buildindex.
Indexation Delta
Mise à jour de l'index actuel avec les modifications capturées dans TI_DELTA_CATENTRY à l'aide de l'API RESTful buildindex.
Explorateur
Utilitaire Commerce pour explorer le contenu non géré pour l'indexation dans l'index non structuré (ex. fichiers HTML).
Index d'extension
Un noyau qui étend le noyau CatalogEntry pour stocker des données spécifiques pour les entrées du catalogue. Par exemple, l'index de stock étend le noyau CatalogEntry pour stocker les informations de stock pour chaque entrée de catalogue. Puisque ces informations sont séparées dans un noyau différent, vous pouvez regénérer ce petit noyau souvent et rapidement. Ce noyau vous permet de maintenir les comptes de stock à jour, tout en indexant votre noyau CatalogEntry potentiellement volumineux une fois par jour.

L'environnement Elasticsearch

Elaticsearch
Technologie de recherche utilisée par HCL Commerce Search pour effectuer la navigation basée sur la recherche et le marchandisage à la vitrine.
Apache NiFi
Une technologie de flux de données utilisée par HCL Commerce Search comme pipeline d'indexation pour extraire, transformer et charger des données métier/de catalogue dans Elasticsearch.
Apache ZooKeeper
Une technologie de magasin de valeur de clé utilisée par HCL Commerce Search pour gérer les configurations personnalisées.

L'environnement d'exécution Apche Solr

L'exécution de recherche se compose de l'application Solr et des processus et utilitaires HCL Commerce associés.

Séquençage de recherche approfondi
Tri des produits pour la navigation de catégorie à l'aide de la valeur de séquence du produit et de la valeur de séquence de sa catégorie parent.
Séquençage peu profond
Tri des produits pour la navigation de catégorie à l'aide de la valeur de séquence du produit.
Profil de recherche
Abstraction d'un scénario de recherche spécifique, défini dans wc-search.xml. Le profil de recherche contient les zones recherchées, les fournisseurs d'expression, les pré-processeurs et les post-processeurs de requêtes à utiliser, ainsi que d'autres informations pertinentes. Par exemple, la recherche de produits et la récupération d'une catégorie spécifique renvoient différentes informations et nécessitent la recherche de données différentes. Dans ce cas, vous devez utiliser différents profils de recherche pour ces scénarios. IBM_findCategoryByIdentifier est un profil de recherche qui peut être utilisé pour récupérer des informations de catégorie en fonction d'une valeur catgroup_id spécifique. Vous pouvez utiliser le profil IBM_findProductsBySearchTerm pour récupérer des informations de produit basées sur un terme de recherche.
Fournisseur d'expressions
Utilisé pour modifier les paramètres de contrôle disponibles pour la requête de recherche. Par exemple, si vous souhaitez remplacer le tri utilisé pour la requête de recherche, vous pouvez utiliser un fournisseur d'expressions afin de modifier le paramètre de contrôle _wcf.search.sort. Les fournisseurs d'expressions permettent de modifier les valeurs des paramètres de contrôle avant qu'elles ne soient lues par les pré-processeurs de requête et ajoutées à la requête.
Préprocesseur de requête
Utilisé pour modifier la requête avant qu'elle ne soit traitée par HCL Commerce Search. Par exemple, si vous souhaitez filtrer les entrées de catalogue qui ont un nom de fabricant, vous pouvez utiliser un pré-processeur de requêtes pour ajouter un paramètre de requête tel que fq=mfName:*. Peut utiliser les paramètres de contrôle fournis pour la requête de recherche afin d'ajouter des données à la requête (par exemple, pour ajouter un paramètre de tri basé sur la valeur dans le paramètre de contrôle _wcf.search.sort).
Postprocesseur de requêtes
Utilisé pour modifier les résultats de la requête avant qu'ils ne soient renvoyés en tant que réponse de la recherche. Un post-processeur de requêtes peut être utilisé pour ajouter des produits à la réponse de requête en fonction d'une condition particulière (par exemple, si un fabricant spécifique existe dans les résultats de recherche).
Suggestion automatique
Fonction de saisie à l'avance utilisée dans la barre de recherche pour compléter votre phrase en cours de saisie avec des correspondances possibles. Par exemple, shir peut correspondre à shirt..
Vérification orthographique
Utilisé lorsqu'une recherche ne renvoie aucun résultat (ou seulement quelques-uns selon votre configuration) pour déterminer quelle était la recherche prévue. Par exemple, rechercher cofe ne renvoie aucun résultat, mais la fonction de vérification orthographique soupçonne que vous vouliez rechercher le terme "café" (qui a beaucoup plus de correspondances). Le résultat est renvoyé dans la section "Vous vouliez dire…" de la page.
Facettes
Filtres permettant de réduire les résultats de recherche afin de les rendre plus pertinents par rapport aux attentes de l'utilisateur. Par exemple, une facette de taille peut être utilisée pour afficher uniquement les résultats de recherche disponibles dans une taille spécifique.
Attribut descriptif
Utilisé pour décrire une entrée de catalogue. Par exemple, vous pouvez affecter à un t-shirt un attribut descriptif comme le matériau, avec une valeur coton. Peut être utilisé comme une facette si l'attribut est considéré comme apte aux facettes.
Attribut de définition
Utilisé pour définir une caractéristique pour une entrée de catalogue. Par exemple, vous pouvez affecter à un t-shirt un attribut de définition comme la taille, avec une valeur large. Peut être utilisé comme une facette si l'attribut est considéré comme apte aux facettes.
Règle de recherche
Utilisé pour influencer l'ordre ou le contenu d'une recherche en fonction de déclencheurs spécifiques. Par exemple, si un utilisateur recherche du café, vous pouvez stimuler la pertinence des produits fabriqués par le fabricant Coffee King.
Association de termes de recherche
Utilisé pour modifier ou ajouter des termes de recherche dans la requête de recherche, ou rediriger l'utilisateur vers une page spécifique. Les synonymes sont utilisés pour ajouter des mots à la phrase de recherche (si X est recherché, recherchez également Y). Les remplacements sont utilisés pour remplacer les mots dans l'expression de recherche (si X est recherché, recherchez plutôt Y). Les pages d'accueil sont utilisées pour diriger l'utilisateur vers une page spécifique si un terme de recherche spécifique se trouve dans l'expression de recherche. Par exemple, si X est recherché, redirigez l'utilisateur vers la page Y.
Regroupement des résultats de recherche
Utilisé pour effectuer des recherches dans des groupes d'entrées de catalogue, en renvoyant le représentant du groupe lorsqu'il y a une correspondance sur un résultat dans le groupe. Par défaut, les représentants du groupe sont des produits et chaque groupe est composé d'un produit et de ses articles associés. Vous pouvez effectuer une recherche sur le produit et ses articles, et renvoyer le produit pour qu'il s'affiche lorsqu'il y a une correspondance sur le produit ou l'un de ses articles.

Architecture

L'architecture du produit de recherche comprend les principaux éléments logiciels et matériels intégrés. L'architecture inclut les serveurs, les canaux de données qui les connectent et les protocoles de communication qu'ils utilisent.

Recherche basée sur REST
Les requêtes de recherche sont envoyées au serveur de recherche en tant qu'URL REST. La majeure partie du scénario de recherche est traitée sur le serveur de recherche lui-même, et les résultats de la recherche sont renvoyés sous forme de réponse JSON.
Environnement de données
Une infrastructure réseau dédiée à l'hébergement des services de données de la version 9.1. Chaque environnement est généralement limité à une étape d'un cycle de vie de version, comme le développement, l'assurance qualité, le transfert, la production. Lorsque les données sont promues d'un environnement de transfert inférieur vers un environnement de production plus élevé, cela implique le déplacement des données de l'environnement de données de transfert vers l'environnement de données de production.
Plateforme de données
Un concept de plateforme en tant que service (PaaS) dans lequel l'infrastructure telle que les serveurs, le stockage, le réseau, ainsi que les services de données de logiciel intermédiaires, sont tous intégrés en une seule plateforme. Il prend en charge le cycle de vie complet de l'application Web : la génération, les tests, le déploiement, la gestion et la mise à jour.
Services de données
Un ensemble de microservices qui s'articule autour de Elasticsearch, NiFi et Zookeeper pour fournir une solution technologique intégrée. Les services permettent de régir, d'accéder et de les fournir des données métier aux utilisateurs finaux, aux applications de données ou à d'autres technologies à des fins commerciales stratégiques.