Présentation de l'Utilitaire d'extraction de donnée

L'Utilitaire d'extraction de donnée est un utilitaire de ligne de commande dont vous pouvez vous servir pour extraire des données depuis la base de données HCL Commerce dans un fichier de sortie.

Vous pouvez exécuter l'utilitaire dans les environnements de transfert et de production, mais il est recommandé de l'exécuter dans un environnement qui comporte toutes les informations que vous devez extraire. Par exemple, il se peut que l'environnement de transfert ne comporte pas les informations de stock ou de tarification pour une entrée de catalogue. Dans ce cas, exécutez l'utilitaire dans l'environnement de production.

Cet utilitaire se sert de l'infrastructure de l'pour l'utilitaire de chargement de données et suit un processus d'interaction similaire :

Le lecteur de données configuré pour l'utilitaire lit les données à extraire depuis la base de données et les renvoie au générateur d'objet métier.
Le générateur d'objet métier remplit un objet métier qui s'appuie sur les données transmises depuis le lecteur de données. Il transmet l'objet au médiateur d'objet métier.
Le médiateur d'objet métier transforme l'objet métier en liste d'objets de mappe qui est ensuite transmise à l'éditeur de données.
L'éditeur de données génère ensuite le fichier de sortie configuré et écrit la liste des objets CSV ou XML dans le fichier de sortie.

Il existe deux méthodes d'extraction des données dont vous pouvez vous servir avec l'Utilitaire d'extraction de donnée : l'extraction reposant sur SQL et l'extraction reposant sur la logique métier. La méthode d'extraction dont l'utilitaire doit se servir dépend du type de données à extraire.

Si vous voulez extraire des promotions, des objets marketing ou Commerce Composer, vous devez utiliser l'extraction reposant sur SQL.
Si vous voulez extraire des données de catalogue afin de générer des données Enterprise Product Report (EPR) à utiliser avec IBM Product Recommendations, vous devez utiliser l'extraction reposant sur la logique.

Extraction reposant sur SQL

L'extraction reposant sur SQL utilise une connexion de base de données directe et des instructions SQL pour extraire les données. A moins que vous ne procédiez à l'extraction des données en vue de les utiliser avec IBM Product Recommendations, ou que vous ne procédiez à l'extraction de données ne pouvant pas être extraites directement depuis la base de données, il est recommandé d'utiliser cette approche SQL. Le processus d'extraction reposant sur SQL améliore les performances et la souplesse de l'utilitaire par rapport à la méthode d'extraction reposant sur la logique métier.

Le processus reposant sur SQL peut également réduire le coût d'implémentation relatif à la personnalisation de l'utilitaire afin d'extraire les données qui ne peuvent pas être extraites avec l'utilitaire par défaut. Par défaut, l'utilitaire prend en charge l'extraction des types de données suivants avec le processus d'extraction reposant sur SQL :

promotions
Objets Commerce Composer, tels que des widgets, des agencements, des modèles d'agencement et des pages
Objets marketing, tels que des activités, des emplacements e-Marketing, du contenu, des campagnes, des pièces jointes et des segments de clientèle

Afin de configurer l'utilitaire pour qu'il se serve d'un processus d'extraction reposant sur SQL plutôt que du processus reposant sur la logique métier, configurez l'utilitaire de sorte qu'il se serve des classes suivantes :

UniqueIdReader: Cette classe de lecteur de données permet à l'utilitaire de se servir d'instructions SQL pour extraire la valeur d'ID unique d'un objet métier. La classe de lecteur de données peut ensuite envoyer un objet de mappe pour l'objet métier au générateur d'objet métier.
AssociatedObjectMediator: Ce médiateur d'objet métier permet à l'utilitaire de se servir d'instructions SQL afin d'extraire les informations d'objet métier détaillées pour l'objet de mappe. Le médiateur peut ensuite envoyer un objet de mappe mis à jour qui contient les informations d'objet métier détaillées à la classe de l'éditeur de classe configurée.
CSVWriter: Classe d'éditeur de données pouvant convertir les objets de mappe qui sont envoyés par le médiateur d'objet métier en enregistrement au format CSV. Cette classe d'éditeur de données peut ensuite écrire l'enregistrement dans le fichier de sortie CSV configuré. Utilisez cette classe d'éditeur de données ou la classe d'éditeur de données XmlWriter.
XmlWriter: Classe d'éditeur de données qui peut convertir les objets de mappe envoyés par le médiateur d'objet métier en élément au format XML. Cette classe d'éditeur de données peut ensuite écrire l'élément et tout sous-élément dans le fichier de sortie XML configuré. Utilisez cette classe d'éditeur de données ou la classe d'éditeur de données CSVWriter.
ValueHandler: Cette interface fournit un point de personnalisation dont vous pouvez vous servir lorsque l'utilitaire ne peut pas extraire les données directement depuis la base de données. Vous pouvez également utiliser cette classe lorsque vous devez modifier des données avant que la classe d'éditeur de données n'écrive les données dans le fichier de sortie.

Pour plus d'informations sur la configuration de l'Utilitaire d'extraction de donnée pour l'utilisation de ces classes et du processus d'extraction reposant sur SQL, voir Configuration et exécution de l'utilitaire d'extraction de données. Lorsque vous configurez l'utilitaire, il est recommandé de copier et d'éditer les exemples de fichier de configuration fournis, qui permettent de configurer et d'exécuter l'utilitaire rapidement.

Extraction reposant sur la logique métier

Cette approche utilise la logique métier pour extraire les données, comme un service Web existant. La classe de lecteur de données configurée pour l'utilitaire se sert d'un service Web de catalogue afin d'extraire les données au format objet métier catalogue (nom). La classe de générateur d'objet métier ne remplit aucune donnée au cours de ce processus. A la place, elle transmet les objets de type nom à la classe de médiateur d'objet métier. La classe de médiateur est ensuite utilisée pour extraire les données depuis l'objet métier afin de générer un objet de mappe. L'éditeur de données convertit ensuite l'objet de mappe en fichiers de sortie au format CSV, comme des fichiers EPCMF et ECDF pouvant être utilisés avec .

Cette approche reposant sur la logique métier est utile lorsque les données ne peuvent pas être extraites directement de la base de données, par exemple lorsqu'une logique métier compliquée est nécessaire pour calculer les données, comme lors de l'extraction des données de prix utilisant des règles de tarification. Afin d'extraire ces données de prix, une logique est nécessaire pour appliquer les règles de tarification de sorte que les prix d'entrée de catalogue puissent être déterminés, extraits et écrits dans un fichier de sortie. Lorsqu'une logique métier compliquée est requise, il n'est pas nécessaire de réimplémenter la logique qui est utilisée pour charger ou créer les données en vue de l'extraction des données.

Toutefois, cette approche présente des inconvénients :

Elle peut ralentir les performances du processus d'extraction. Les services s'appuyant sur la logique pour l'extraction des données ont été conçus pour extraire un objet métier unique ou une liste d'objets métier. Cependant, si l'un des objets métier est trop volumineux, les performances peuvent se dégrader.
La personnalisation du processus d'extraction nécessite un effort significatif d'extraction des données personnalisées ou de données qui ne sont pas prises en charge dans le cadre de l'extraction par défaut. Si vous devez extraire des données personnalisées ou des données qui ne sont pas prises en charge dans le cadre de l'extraction avec l'utilitaire, vous devez implémenter vos propres services personnalisés afin d'extraire les données.

Fichiers de configuration pour l'Utilitaire d'extraction de donnée

L'Utilitaire d'extraction de donnée se sert de trois types de fichier de configuration. Des exemples de chaque type de fichier sont fournis, mais vous devez les mettre à jour avec les informations de configuration propres à votre environnement. Ces fichiers de configuration reposent sur les fichiers de configuration de l'pour l'utilitaire de chargement de données, mais incluent des extensions.

wc-dataextract.xml

Fichier de configuration de l'ordre que vous devez désigner lorsque vous exécutez l'Utilitaire d'extraction de donnée. Il spécifie les chemins d'accès au fichier de configuration de l'environnement et au fichier de configuration d'objet métier.

wc-dataextract-env.xml

Il comporte les variables d'environnement pour votre instance HCL Commerce. Ces variables incluent les informations suivantes :

Variables de contexte métier, notamment l'identificateur de magasin, l'identificateur de catalogue, ainsi que la langue et la devise par défaut pour votre magasin.
Paramètres d'environnement de base de données, notamment le type, le nom et le schéma de base de données.

wc-dataextract-business_object.xml

Fichier de configuration d'objet métier, qui configure la façon dont l'utilitaire identifie les données à extraire pour un objet métier spécifique. Par défaut, des exemples de fichier de configuration d'objet métier sont fournis pour l'extraction de données pour les types d'objet suivants avec le processus d'extraction reposant sur SQL :

Objets de l'outil de composition Commerce
Exemples de fichier de configuration pour l'extraction de widgets, de présentations, de modèles et de pages de l'outil de composition Commerce. Les fichiers sont configurés pour générer des fichiers CSV dont vous pouvez vous servir avec l'pour l'utilitaire de chargement de données.
promotions
Les exemples de fichier de configuration pour l'extraction de données de promotion sont configurés pour générer un fichier XML dont vous pouvez vous servir avec l'pour l'utilitaire de chargement de données.
Objets marketing
Des exemples de fichier de configuration sont fournis pour l'extraction d'activités marketing, de campagnes, de contenu, de pièces jointes, de segments de clientèle et d'emplacements e-Marketing. Les fichiers sont configurés pour générer des fichiers CSV dont vous pouvez vous servir avec l'pour l'utilitaire de chargement de données.

Ces fichiers incluent les informations suivantes :

Des informations sur le contexte métier.
Les mappages de données qui sont requis pour transformer des objets métier HCL Commerce en données pouvant être écrites dans le fichier de sortie.
Des définitions pour l'ordre dans lequel l'utilitaire écrit les données dans les colonnes dans le fichier.
Des pointeurs vers les interfaces et les classes d'implémentation dont l'utilitaire se sert pour extraire et transformer les données.

Remarque : Des exemples de fichier de configuration sont également fournis pour l'extraction de données d'entrée de catalogue dans un fichier EPCMF et pour l'extraction de données de catégorie dans un fichier ECDF pouvant être utilisés avec IBM Product Recommendations. Ils configurent l'utilitaire en vue de l'utilisation de la méthode d'extraction reposant sur la logique métier. Pour plus d'informations sur la configuration de l'utilitaire en vue de l'utilisation de ces exemples de fichier, voir Utilitaire d'extraction de données pour les recommandations dynamiques dans.

Meilleures pratiques

Lorsque vous vous servez de l'Utilitaire d'extraction de donnée, vous pouvez suivre certaines recommandations d'ordre général relatives à la configuration pour tirer pleinement parti de toutes les capacités de l'utilitaire. Pour plus d'informations, voir Utilitaire d'extraction de donnée pratiques recommandées.