Modifications apportées à l'édition pour NiFi

9.1.7 Modifications apportées à l'édition

i. Le groupe de processus Rechercher des articles enfant a été supprimé de Product Stage 1b: Le groupe de processus Rechercher des articles enfant est supprimé de Product Stage 1b. La logique de recherche d'articles enfant est déplacée vers une nouvelle étape appelée Product Stage 1h.
ii. Product Stage 1f (attributs de cumul) et ses attributs WaitLink et RefreshLink ont été supprimés: La logique de cumul a été combinée dans Product Stage 1e pour de meilleures performances.
iii. Product Stage 2 (déplacement vers le bas) et ses éléments WaitLink et RefreshLink ont été supprimés: La logique d'attribut de déplacement vers le bas a maintenant été combinée dans Product Stage 1e pour de meilleures performances. D'autres zones logiques de déplacement vers le bas ont été combinées avec d'autres étapes.
iv. Product Stage 1c (remplacer les attributs enfant) et ses attributs WaitLink et RefreshLink ont été supprimés: La logique de remplacer les attributs enfant n'est plus nécessaire avec la nouvelle logique de Product Stage 1e.
v. Product Stage 1d (rechercher une pièce jointe de l'article) et ses éléments WaitLink et RefreshLink ont été supprimés: La logique rechercher une pièce jointe de l'article n'est plus nécessaire avec la nouvelle logique dans Product Stage 1b.
vi. NRT/Dataload ProductStage4, DatabaseProductStage1e-2 et DatabaseProductStage1f-2 ont été supprimés: La logique de ces étapes n'est plus nécessaire avec la nouvelle logique optimisée. ProductStage4 et ProductStage1e-2 ont également été supprimés du pipeline de chargement de données.

9.1.8 Modifications apportées à l'édition

i. ProductStage 1f supprimé: Les étapes de roulement (1e) et de déplacement vers le bas (1f) du connecteur d'attributs de produit ont été combinées dans une étape plus performante, Product Stage 1e.
iii. CategoryStage2 a été remplacé par Category Stage 1d et remanié: Auparavant, CategoryStage2 générait la hiérarchie de catégories en interrogeant Elasticsearch. Dans la version 9.1.8, la hiérarchie des catégories est générée en lisant depuis la base de données pour améliorer les performances et la fiabilité.

9.1.9 Modifications apportées à l'édition

i. URLStage2a et URLStage2b ont été supprimés avec leurs Waitlinks: URL Stage 1a a été mis à jour pour écrire simultanément dans l'index URL et l'Index Catégorie (ajouter un référencement). Cela évite les problèmes où URL Stage 2a interroge Elasticsearch avant l'achèvement du document URL.; Etant donné que URL Stage 1a (copier vers la catégorie) ajoute déjà le référencement à l'index de catégorie, URL Stage 2a n'est plus nécessaire et a été supprimée. Il en va de même pour URL Stage 1b (copier vers le produit) et il a été supprimé.
ii. CategoryStage4 (Suppression de catégorie) supprimé dans les pipelines NRT et Live: CategoryStage4 (Suppression de catégorie) a été supprimé d'avant Category Stage 1a (Document principal). Cette étape a été précédemment utilisée afin de gérer les cas extrêmes pour la suppression. Etant donné que la hiérarchie de catalogue est désormais générée directement à partir de la base de données, cette étape n'est plus nécessaire et peut être supprimée. Cette modification améliore le temps d'indexation global.

9.1.12 Modifications apportées à l'édition

Les modifications suivantes s'appliquent aux schémas de catégorie, de produit et d'attribut.

i. De nouveaux analyseurs ont été ajoutés.

Ces analyseurs utilisent différents outils de segmentation et filtres, qui sont appliqués à différentes zones d'index pour effectuer le traitement de l'analyse de texte sur des termes lors de l'ingestion et au moment de l'index, ainsi que lors du traitement de la requête et de l'exécution de la recherche.

custom_splitter: Utilise l'outil de segmentation de mot clé.
custom_shingle: Utilise un outil de segmentation standard.
custom_analyzer: Utilise un outil de segmentation standard.

Reportez-vous à la documentation Elasticsearch pour plus de détails sur l'analyse de texte.

ii. De nouveaux filtres ont été ajoutés.

Les filtres Elasticsearch suivants peuvent désormais être utilisés dans des analyseurs personnalisés pour convertir (normaliser, traiter préalablement) les valeurs de zone d'index à utiliser dans l'index Elasticsearch

html_strip_filter
Supprime les éléments HTML du texte et remplace les entités HTML par leurs valeurs décodées.
asciifolding
Convertit les caractères alphabétiques, numériques et symboliques qui ne se trouvent pas dans le bloc Unicode latin de base.
word_delimiter_filter
Fractionne les jetons au niveau des caractères non alphanumériques.
shingle_filter
Ajoute des bardeaux, ou mot n-grammes, à un flux de jetons en concaténant des jetons adjacents.
trim_filter
Supprime les espaces de début et de fin de chaque jeton d'un flux.

iii. La propriété normaliseur a changé

La propriété normaliseur est passée de minuscules à normalisé, car elle modifie non seulement le mot en minuscules, mais effectue également un compactage ASCII. Ce normaliseur est utilisé dans toutes les zones d'index normalisées.