Indexation documentaire des pièces jointes à l'aide de filtres de conversion
Lorsque l'indexation documentaire des pièces jointes est réalisée à l'aide de filtres de conversion, le serveur Domino® et le client Notes® standard utilisent des filtres de conversion open source Apache Tika 1.24.1 pour extraire du texte pour les recherches documentaires de pièces jointes.
- Filtrer un large éventail de formats.
- Filtrer des fichiers de texte ASCII qui contiennent du codage UTF-8.
Tika s'exécute en tant que processus Java™ lorsque vous démarrez le client standard Notes® ou Domino®. Le processus appelle tika-server.jar, qui démarre alors un serveur HTTP et écoute les demandes d'extraction de texte sur le port 9998, par défaut. Si vous effectuez une mise à niveau vers le client standard the Notes® ou Domino® 10, ou une version ultérieure, les index documentaires qui ont précédemment utilisé des filtres KeyView pour extraire du texte sont reconstruits à l'aide des filtres Tika.
Pour obtenir la liste des formats de fichiers pris en charge par Tika 1.24.1, consultez le site Web Apache Tika.
TIKA_PORT=9997Le client de base Notes® n'utilise pas de filtres Tika pour filtrer des pièces jointes pour les bases de données locales. Les utilisateurs du client de base Notes® peuvent choisir d'indexer des pièces jointes pour les bases de données locales, mais seules des pièces jointes en texte ASCII sont indexées et peuvent être recherchées.