Utilitaire d'extraction de donnée

L'Utilitaire d'extraction de donnée, qui utilise l'infrastructure de l'pour l'utilitaire de chargement de données, extrait des données depuis la base de données HCL Commerce dans un fichier de sortie.

Vous pouvez exécuter cet utilitaire dans les environnements de transfert et de production. Toutefois, il est recommandé de l'exécuter dans un environnement qui comporte toutes les informations que vous devez extraire pour un objet. Par exemple, il se peut que l'environnement de transfert ne comporte pas les informations de stock ou de tarification pour une entrée de catalogue. Dans ce cas, exécutez l'utilitaire dans l'environnement de production.

Pour des informations générales sur l'Utilitaire d'extraction de donnée, voir Présentation de l'Utilitaire d'extraction de donnée.

Remarque : Si vous intégrez HCL Commerce à , servez-vous de cet utilitaire pour générer des données Enterprise Product Report (EPR) à utiliser avec . Avant d'extraire ces données, vous pouvez configurer l'utilitaire pour qu'il génère des fichiers ECDF et EPCMF au format approprié à charger dans . Pour plus d'informations, voir Utilitaire d'extraction de données pour les recommandations dynamiques dans.

Syntaxe de commande


Diagramme de syntaxe de l'utilitaire d'extraction de données

Valeurs des paramètres

chemin_complet
Il s'agit du chemin d'accès complet au fichier de configuration de l'ordre pour l'Utilitaire d'extraction de donnée.
-DXmlValidation
(Booléen) Active ou désactive la validation XML. Pour plus de précision, les configurations définies dans les fichiers XML sont validées en fonction des fichiers XSD de l'Utilitaire d'extraction de donnée et de l'pour l'utilitaire de chargement de données. La validation XML est activée par défaut (définie à 'true'). Si vous désirez la désactiver, spécifiez -DXmlValidation=false.
-DLoadOrder
Spécifie l'ordre d'extraction des données depuis la base de données. Ce paramètre supplante l'élément LoadOrder dans le fichier de configuration de l'ordre. Vous pouvez spécifier le nombre d'objets à extraire de votre choix, en les séparant par une virgule. Veillez à ce que les valeurs de paramètre ne comportent pas d'espaces blancs. S'ils contiennent des espaces blancs, encadrez les paramètres par des guillemets. Par exemple,
"-DLoadOrder=loadItemName1, loadItemName2"
-DConsoleHandler.level
Permet de remplacer le niveau de journalisation de la console défini dans le fichier utilities_root\dataextract\logging.properties. Entrez, par exemple, -DConsoleHandler.level=SEVERE pour définir ce niveau de journalisation à SEVERE.
-DFileHandler.level
Permet de remplacer le niveau de journalisation défini dans le fichier utilities_root\dataextract\logging.properties. Par exemple, entrez -DFileHandler.level=WARNING pour modifier le niveau de journalisation du fichier à WARNING.
-Dpackage_name.level
package_name est le nom de n'importe quel package. Ce paramètre permet de remplacer le niveau de journalisation pour le module spécifié. Si package_name est vide (-D.level=level name), le niveau de journalisation est changé pour tous les packages. Le level name peut être : OFF, SEVERE, WARNING, INFO, CONFIG, FINE, FINER, FINEST ou ALL.
Pour traiter les erreurs qui peuvent survenir lorsque vous exécutez l'Utilitaire d'extraction de donnée, vous pouvez remplacer les niveaux de journalisation. Par exemple, remplacez les modules de l'pour l'utilitaire de chargement de données suivants pour lesquels la journalisation, que l'Utilitaire d'extraction de donnée peut utiliser, est disponible :
-Dcom.ibm.commerce.foundation.dataload.businessobjectbuilder.level
-Dcom.ibm.commerce.foundation.dataload.businessobjectmediator.level
-Dcom.ibm.commerce.foundation.dataload.config.level
-Dcom.ibm.commerce.foundation.dataload.datareader.level
-Dcom.ibm.commerce.foundation.dataload.datawriter.level
-Dcom.ibm.commerce.foundation.dataload.idresolve.level
-Dcom.ibm.commerce.foundation.dataload.database.level
-Dcom.ibm.commerce.foundation.dataload.level 
Pour plus d'informations sur le changement du niveau de journalisation d'un module, voir Configuration de la journalisation pour les environnements d'exécution. Pour en savoir davantage sur la journalisation, reportez-vous à la section Services de journalisation

Exécution de l'Utilitaire d'extraction de donnée

  1. HCL Commerce DeveloperDans une ligne de commande, accédez au répertoire WCDE_installdir\bin.
  2. LinuxOuvrez une ligne de commande dans le . Accédez au répertoire utilities_root/bin. Pour plus d'informations sur l'entrée et la sortie des conteneurs, voir Exécution des utilitaires à partir de Utility server Docker container.
  3. Exécutez la commande ci-dessous pour vous servir de l'Utilitaire d'extraction de donnée afin d'exécuter le fichier de configuration de l'ordre spécifié. Le fichier identifie les fichiers de configuration d'objet métier qui définissent la façon dont les données sont extraites.
    • Linux./dataextract.sh ../path_to_order_configuration_file/wc-dataextract.xml
    • HCL Commerce Developerdataextract ..\path_to_order_configuration_file\wc-dataextract.xml
    path_to_order_configuration_file
    Chemin d'accès relatif au fichier de configuration de l'ordre qui identifie les fichiers de configuration dont vous vous servez avec l'Utilitaire d'extraction de donnée.
    wc-dataextract.xml
    Fichier de configuration de l'ordre. Des exemples de fichier sont fournis avec HCL Commerce dans les répertoires suivants :
    • Linuxutilities_root/samples/DataExtract
    • HCL Commerce DeveloperWCDE_installdir\samples\DataExtract
    Par défaut, l'exemple de fichier de configuration de l'ordre est généralement appelé wc-dataextract.xml ou wc-dataextract-object.xmlobject est le type d'objet qui est extrait. Ces fichiers sont structurés de la même façon que les fichiers de configuration de l'ordre qui sont utilisés pour configurer l'pour l'utilitaire de chargement de données, mais ils incluent des extensions.
    Par exemple, la commande suivante exécute l'Utilitaire d'extraction de donnée pour extraire des objets de promotion :
    • Linux./dataextract.sh ../samples/DataExtract/Promotion/wc-dataextract.xml
    • HCL Commerce Developerdataextract ..\samples\DataExtract\Promotion\wc-dataextract.xml
Remarque : Etant donné que l'Utilitaire d'extraction de donnée se sert de l'infrastructure de l'pour l'utilitaire de chargement de données, vous pouvez aussi configurer l'pour l'utilitaire de chargement de données pour extraire des données. Vous pouvez configurer la commande d'pour l'utilitaire de chargement de données afin d'utiliser certains fichiers de configuration de l'Utilitaire d'extraction de donnée qui se trouvent dans les sous-dossiers du répertoire suivant :
  • Linuxutilities_root/samples/DataExtract
  • HCL Commerce DeveloperWCDE_installdir\samples\DataExtract
Vous ne pouvez pas configurer l'pour l'utilitaire de chargement de données afin d'extraire des données de catalogue pour la génération de données Enterprise Product Report (EPR) à utiliser avec IBM Product Recommendations. Vous devez vous servir de l'Utilitaire d'extraction de donnée pour extraire ces données.

Identification des incidents

Vous pouvez rencontrer des erreurs lorsque vous exécutez l'utilitaire pour plusieurs raisons. Des erreurs peuvent être causées par des paramètres de commande ou des configurations non valides, entre autres. Pour traiter les erreurs que vous rencontrez, examinez d'abord le fichier wc-dataextract.log pour déterminer la source de l'erreur. Ce fichier peut se trouver dans le répertoire suivant :

  • Linuxutilities_root\logs
  • WCDE_installdir\logs
Par défaut, ce fichier journal ne fournit qu'un rapport récapitulatif. Toutefois, vous pouvez spécifier le niveau de journalisation du module lorsque vous exécutez l'utilitaire afin de générer davantage d'informations sur le processus d'extraction dans ce fichier journal. Par exemple, pour exécuter l'utilitaire avec un niveau de journalisation plus détaillé pour les informations de catalogue, vous pouvez spécifier la commande suivante, qui inclut le paramètre -Dpackage_name.level :
dataextract.sh wc-dataextract.xml -Dcom.ibm.commerce.catalog.dataload.level=FINER