Fichiers de configuration du chargement d'index pour l'indexation à partir des fichiers CSV

Vous pouvez charger des informations d'index de chargement à partir d'un fichier CSV. Le chargement d'index nécessite des fichiers de configuration avant de pouvoir être exécuté à partir d'un navigateur Web.

Chargement de l'index à partir d'un fichier CSV

Suivez ces étapes pour charger les informations d'index à partir d'un fichier CSV.

  1. Modifiez le fichier de configuration wc-dataload-profile.xml et ajoutez l'emplacement du fichier CSV, ainsi que le nom de base cible.
  2. Spécifiez CSVReader en tant que lecteur et SolrIndexLoadMapObjectBuilder en tant que constructeur d'objets métier dans wc-businessObject-profile.xml.
Si vous utilisez un fichier CSV pour charger des données d'index, Chargement d'index nécessite trois fichiers de configuration. Ces fichiers sont basés sur les définitions de schéma XML de la structure Chargement des données :

Fichiers de configuration du chargement d'index

Fichier de configuration du chargement d'index Fichier de définition de schéma
Fichier de configuration d'environnement (wc-indexload-env.xml) wc-dataload-env.xsd
Fichier de configuration de profile (wc-indexload-profileName.xml) wc-indexload.xsd
Fichier de configuration d'articles de profil (wc-indexload-businessobject.xml) wc-indexload-item.xsd

Fichier de configuration d'environnement (wc-indexload-env.xml)

Le fichier wc-indexload-env.xml contient des informations de contrôle d'environnement et des propriétés globales requises par le chargement d'index, y compris un programme d'écriture de données commun et une source de données à utiliser pour conserver les données.

Le fichier wc-indexload-env.xml ne nécessite généralement pas de personnalisation. Vous pouvez utiliser l'exemple de fichier par défaut tel quel.

Fichier de configuration de profile (wc-indexload-profileName.xml)

Le fichier wc-indexload-profileName.xml contient des attributs de performance configurables et des configurations d'articles de chargement.

Les noms de profil que vous définissez dans les fichiers de configuration sont ensuite remplacés en tant que paramètre URL lorsque vous appelez Chargement d'index dans un navigateur Web.

Les configurations d'articles de charge sont répertoriées dans la section ordre de charge de ce fichier. Elles sont traitées dans le même ordre qu'elles sont spécifiées.

Elles peuvent contenir une ou plusieurs définitions de LoadItem, chaque configuration LoadItem spécifiant la configuration LoadItem spécifique et la cible coreName. Plusieurs LoadItems sont exécutés en parallèle, sans séquence.

Exemple : wc-indexload-price.xml

<_config:LoadItem name="ExternalPrice-1" businessObjectConfigFile="wc-indexload-price-sql.xml">
			<_config:property name="coreName" value="MC_10001_CatalogEntry_Price_generic" />
			<_config:property name="groupName" value="1" />
	  </_config:LoadItem>

Les attributs de performance configurables suivants s'appliquent aux fichiers de configuration de profil :
batchSize
Le seuil à partir duquel les documents sont stockés en mémoire de façon temporaire.
La valeur par défaut est 1. Si une valeur de 0 est spécifiée, la validation a lieu une fois l'article de charge exécuté.
commitCount
Le seuil à partir duquel les documents sont stockés en dur à partir de la mémoire.
Vous pouvez définir la valeur commitCount sur 0 si vous utilisez une validation basée sur la mémoire. Pour plus d'informations, voir Réglage de Chargement d'index.
ThreadLaunchTimeDelay
Le temps en millisecondes à attendre avant de démarrer une nouvelle unité d'exécution pour éviter de surcharger le système au démarrage.
La valeur par défaut est 1000.
OptimizeAfterIndexing
Indique si Chargement d'index effectue l'optimisation de l'index après validation.
Remarque : L'exécution de l'optimisation après une indexation complète améliore les performances d'exécution. Toutefois, cela augmente le temps d'indexation global.
StatusRefreshInterval
Le temps maximum en secondes à attendre avant d'actualiser le statut Chargement d'index et de l'afficher dans le journal administratif.
La valeur par défaut est 300. Utilisez une valeur -1 pour désactiver ce service.
DocumentSizeSamplingInterval
L'intervalle de temps en secondes pour calculer la taille du document indexé. Utilisez -1 pour désactiver le service. La valeur par défaut est 300.
IndexHeightCacheHint
Un nombre qui indique au système de déterminer la taille des caches applicables pour la hauteur d'index utilisée lors de l'indexation.
IndexWidthCacheHint
Un nombre qui indique au système de déterminer la taille des caches applicables pour la largeur d'index utilisée lors de l'indexation.

Fichier de configuration d'articles de profil (wc-indexload-external-price.xml)

<_config:LoadItem name="ExternalPrice-1" businessObjectConfigFile="wc-indexload-external-price.xml">
<_config:property name="coreName" value="MC_10001_CatalogEntry_Price_generic" />
<_config:DataSourceLocation location="C:\Patches\delta.csv" />
 </_config:LoadItem>
coreName
Le nom de l'extension du nom principal.
DataSourceLocation
L'emplacement du fichier de données CSV.

Exemples de fichier de configuration

Téléchargez et extrayez l'exemple de code suivant : IndexLoadSampleCode.zip. L'exemple inclut les fichiers de configuration utilisés par Chargement d'index et les mises à jour manuelles effectuées dans la tâche Indexation des prix des contrats à l'aide de Chargement d'index, à titre de référence.