Indexation documentaire des pièces jointes à l'aide de filtres de conversion

Lorsque l'indexation documentaire des pièces jointes est réalisée à l'aide de filtres de conversion, le serveur Domino® et le client Notes® standard utilisent des filtres de conversion open source Apache Tika 1.24.1 pour extraire du texte pour les recherches documentaires de pièces jointes.

Tika remplace le filtre de conversion KeyView utilisé avant Domino 10. L'implémentation de Tika prend en charge les capacités suivantes :
  • Filtrer un large éventail de formats.
  • Filtrer des fichiers de texte ASCII qui contiennent du codage UTF-8.

Tika s'exécute en tant que processus Java lorsque vous démarrez le client standard Notes® ou Domino®. Le processus appelle tika-server.jar, qui démarre alors un serveur HTTP et écoute les demandes d'extraction de texte sur le port 9998, par défaut. Si vous effectuez une mise à niveau vers le client standard the Notes® ou Domino® 10, ou une version ultérieure, les index documentaires qui ont précédemment utilisé des filtres KeyView pour extraire du texte sont reconstruits à l'aide des filtres Tika.

Pour obtenir la liste des formats de fichiers pris en charge par Tika 1.24.1, consultez le site Web Apache Tika.

Remarque : Le tika-server.jar démarre un serveur HTTP et écoute les demandes d'extraction de texte sur le port 9998. Si une autre application utilise déjà ce port, utilisez le paramètre notes.ini suivant pour passer le port Tika sur 9997 :
TIKA_PORT=9997
Remarque :

Le client de base Notes® n'utilise pas de filtres Tika pour filtrer des pièces jointes pour les bases de données locales. Les utilisateurs du client de base Notes® peuvent choisir d'indexer des pièces jointes pour les bases de données locales, mais seules des pièces jointes en texte ASCII sont indexées et peuvent être recherchées.