Indexation documentaire de pièce jointe
Le serveur Domino® et le client Notes® standard utilisent des filtres de conversion open source Apache Tika 1.18 pour extraire du texte pour les recherches documentaires ou les pièces jointes. Tika remplace le filtre de conversion KeyView utilisé dans les précédentes éditions.
- Rechercher un large éventail de formats, y compris des fichiers de conteneur tels que des fichiers .zip et .tar.
- Rechercher des fichiers de texte ASCII qui contiennent du codage UTF-8.
- Personnaliser les types de pièces jointes qui peuvent faire l'objet d'un index documentaire et la taille maximale de la pièce jointe autorisée pour l'indexation documentaire.
Tika s'exécute en tant que processus Java™ lorsque vous démarrez le client standard Notes® ou Domino®. Le processus appelle tika-server.jar, qui démarre alors la tâche HTTP et écoute les demandes d'extraction de texte sur le port 9998, par défaut. Si vous effectuez une mise à niveau vers Notes® ou Domino® 10, les index documentaires qui ont précédemment utilisé des filtres KeyView pour extraire du texte sont reconstruits à l'aide des filtres Tika.
Pour obtenir la liste des formats de fichiers pris en charge par Tika 1.18, consultez le site Web Apache Tika.
TIKA_PORT=9997
Le client de base Notes® n'utilise pas de filtres Tika pour rechercher des pièces jointes dans les bases de données locales. (La limitation ne s'applique pas au client standard Notes ou aux recherches de bases de données basées sur serveur). Les utilisateurs du client de base Notes® peuvent choisir d'indexer des pièces jointes, mais seules des pièces jointes en texte ASCII sont recherchées.