Configuration d'Ingest via REST
Vous pouvez configurer tous vos connecteurs Ingest via un nœud final REST unique. Tous les connecteurs héritent d'un ensemble de configurations telles que les attributs globaux et les rendent disponibles en tant qu'attributs de fichier de flux NiFi dans NiFi. En ayant accès à ce nœud final, vous pouvez ajouter ou supprimer des fonctions NiFi de l'extérieur du flux de processus NiFi principal.
Fonctions Ingest accessibles
Les valeurs d'attribut global par défaut sont les suivantes. Vous pouvez les utiliser pour activer et inclure rapidement une variété de fonctions Ingest.
- alias.keep.backup
- Cette option est utilisée lorsqu'un alias d'index est créé. Elle détermine le nombre de copies d'anciens index à conserver, qui peuvent être conservées à des fins de récupération ultérieure. La valeur par défaut est 2.
cache.invalidation.duration
Définit le nombre maximum de secondes nécessaires à l'invalidation du cache de base. La valeur par défaut est 60 secondes.
cache.invalidation.threshold
Définit le nombre maximum d'entrées nécessaire à la réalisation d'une invalidation incrémentielle du cache. Une invalidation complète du cache est effectuée lorsque ce seuil a été dépassé au cours d'une opération d'ingestion. La valeur par défaut est 10000.
flow.basic.nlp.category.search
Définit s'il faut ou non inclure les noms de catégories lors d'une recherche par terme. Le paramètre est désactivé par défaut. Remarque : l'activation de cette option peut entraîner un nombre de résultats de recherche bien plus important, augmentant ainsi le temps de réponse global.- flow.language.fallback
- Cette fonction permet à Ingest d'indexer le texte à partir de la langue par défaut du magasin pour toute langue qui n'a pas de traduction. L'activation de cette fonction peut avoir un impact significatif sur le temps d'indexation global. La valeur par défaut est
true. - flow.database.listagg
- Cette fonction permet à l'environnement d'exécution Ingest de ne pas utiliser la version de base de données de LISTAGG et d'utiliser l'implémentation LISTAGG au niveau de l'application. Bien que la version de la base de données soit plus rapide, elle a une limitation de longueur de 32 Ko. La valeur par défaut est
true. Pour plus d'informations, voir LISTAGG() et Serialize. - flow.retry.partial
- Cette fonction permet de réessayer uniquement les entrées ayant échoué dans une requête en masse au lieu de l'ensemble du fichier de flux. La valeur par défaut est
false. - flow.marketplace
- Cette fonction permet à Ingest de ne pas inclure les fonctions Marketplace dans les index de recherche. La valeur par défaut est
false.
flow.wait.strategy
Définit la stratégie par défaut pour WaitLink : - Bulk : débloqué uniquement par l'envoi du signal du service Bulk
- Any : identique à Bulk, mais peut également être débloqué par la détection d'une inactivité dans SQL ou Bulk. Il s'agit de la valeur par défaut.
- matchmaker.proximity
- Ce nombre spécifie la plage de proximité que MatchMaker utilise pour l'approximation lors de l'exécution de recherches. La valeur par défaut est 0,2, ce qui signifie +/- 20 %. La valeur par défaut est
0.2. - flow.price.copy
- Cette option permet d'effectuer une copie dynamique des prix de l'index de prix vers l'index de produit dans le ou les types d'environnement donnés. La valeur par défaut est définie sur
"auth, live". - flow.inventory.copy
- Cette option permet une copie dynamique des stocks de l'index de stock vers l'index de produit dans le ou les types d'environnement donnés. La valeur par défaut est définie sur
"auth, live". - flow.concurrent.postindex
- Cette option définit si le connecteur post-index doit être exécuté en arrière-plan. La valeur par défaut est définie sur
false. - cluster.index.nodegroup
- Cette option définit la configuration de groupe de nœuds Elasticsearch utilisée, unique ou double. La valeur par défaut est
single. - cache.invalidation.duration
- Définit le nombre maximum de secondes nécessaires à l'invalidation du cache de base. La valeur par défaut est 60 secondes.
- cache.invalidation.threshold
- Définit le nombre maximum d'entrées nécessaire à la réalisation d'une invalidation incrémentielle du cache. Une invalidation complète du cache est effectuée lorsque ce seuil a été dépassé au cours d'une opération d'ingestion. La valeur par défaut est 10000.
- flow.wait.strategy
- Définit la stratégie par défaut pour WaitLink :
- Bulk : débloqué uniquement par l'envoi du signal du service Bulk
- Any : identique à Bulk, mais peut également être débloqué par la détection d'une inactivité dans SQL ou Bulk. Il s'agit de la valeur par défaut.
- flow.basic.nlp.category.search
- Définit s'il faut ou non inclure les noms de catégories lors d'une recherche par terme. Le paramètre est désactivé par défaut.Note: l'activation de cette option peut entraîner un nombre de résultats de recherche bien plus important, augmentant ainsi le temps de réponse global.
- Utilisez flow.database.schema pour définir le nom du schéma de base de données personnalisé à utiliser pour l'indexation.
- Utilisez custom.table.catentry pour fournir un tableau CATENTRY personnalisé afin d'affiner la portée de base des SQL d'entrée de catalogue.
- Utilisez custom.where.catentry pour fournir une clause
Wherepersonnalisée du tableau CATENTRY personnalisé. - Utilisez custom.table.catgroup pour fournir un tableau CATGROUP personnalisé afin d'affiner la portée de base des SQL de groupe de catalogues.
- Utilisez custom.where.catgroup pour fournir une clause
Wherepersonnalisée du tableau CATGROUP personnalisé.
Pour définir une valeur personnalisée sur une fonction Ingest, vous pouvez émettre l'appel REST suivant :
PATCH /search/resources/api/v2/configuration?nodeName=ingest&envType=authavec le contenu suivant :{ "global": { "connector": [ { "name": "attribute", "property": [ { "name": name_of_ingest_feature, "value": value_of_this_property } ] } ] } }Pour désactiver la version de base de données par défaut de la table LISTAGG, vous devez inclure la charge suivante dans la requête :
{ "global": { "connector": [ { "name": "attribute", "property": [ { "name": "flow.database.listagg", "value": "false" } ] } ] } }