Meilleures pratiques liées à webFeedLoad

Lors de l'exécution de l'utilitaire webFeedLoad, appliquez les meilleures pratiques suivantes.

  1. Traitement des flux volumineux

    Si vous traitez plus de 1000 entrées dans un flux dont le contenu est stocké en tant que fichiers gérés, assurez-vous que le travail du programme de mise à jour EAR, ScheduledContentManagedFileEARUpdateCmdImpl, est arrêté avant que le travail planifié de l'extracteur de flux, FeedDataloadSchedulerCmd, s'exécute.

  2. Modification des fichiers de configuration de chargement de données
    L'extracteur de flux génère un ensemble de fichiers de configuration de chargement de données afin d'optimiser ces fichiers générés à des fins de performances ou pour d'autres raisons.
    1. Exécutez l'utilitaire webFeedLoad avec le paramètre -DGenerateDataLoadConfigOnly=true. Cette option génère les fichiers de configuration de chargement de données, mais ne traite pas le flux.
    2. Vérifiez que vous appliquez les meilleures pratiques décrites pour les fichiers de configuration de chargement de données lorsque vous modifiez les fichiers générés.
    3. Si la configuration de flux n'a pas changé, définissez le paramètre -DGenerateDataLoadConfigOnly sur false pour les exécutions suivantes de l'extraction de flux.
  3. Extraction et traitement de flux delta
    Si votre base de données est importante, définissez la taille du cache du programme de résolution d'ID à 0 pour les faibles charges delta. Par exemple, dans le fichier wc-dataload-env.xml, spécifiez la taille du cache du programme de résolution d'ID à 0 :
    <_config:IDResolver className="com.ibm.commerce.foundation.dataload.idresolve.IDResolverImpl" cacheSize="0" />
  4. Exécution de l'extraction de flux

    Vérifiez que l'utilitaire FeedDataloadSchedulerCmd et l'utilitaire webFeedLoad ne sont pas exécutés simultanément. Vérifiez que le script par lots se termine avant que le travail planifié pour FeedDataloadSchedulerCmd commence.