Application de règles de filtrage
Recherche de portail propose une fonction permettant d'appliquer des règles de filtre au processus d'exploration. Ces filtres contrôlent la progression de l'exploration et le type de documents indexés et catalogués.
Les règles de filtre ne se définissent que lors de la création d'une source de contenu de type Site Web. Les filtres se définissent sous l'onglet Filters. Pour une règle de filtrage, vous pouvez utiliser n'importe quelle combinaison des options suivantes :
| Option de filtre | Paramètres possibles | |
|---|---|---|
| Application de la règle pendant : | Collecte des documents | Indexation de documents |
| Type de règle : | Exclure | Inclure |
| Bases de la règle : | Texte de l'URL | Type de fichier |
Selon les options choisies, les règles de filtre entraînent le comportement suivant pour la sélection des documents ou pages :
| Option d'application de la règle | Option de type de règle sélectionnée : Exclude | Option de type de règle sélectionnée : Include |
|---|---|---|
| Application de la règle pendant la collecte de documents | La page ou le document est exclu, et les liens de la page ne sont pas explorés. | Uniquement les pages et documents conformes aux critères et ayant un lien sur la page parent conforme aux critères, en commençant par le site initial. |
| Application de la règle pendant l'ajout de documents à l'index | La page ou le document est exclu, et les liens de la page sont explorés. | Tout le site fait l'objet de la recherche, seront inclus les pages et documents conformes aux critères de filtrage. |
Remarque : Lorsque vous utilisez l'option Appliquer la règle lors de la collecte des documents avec le type de règle : Inclusion, assurez-vous que l'URL qui se trouve dans la zone Collecter les documents liés à partir de cette URL : correspond à la règle spécifiée. Sinon, aucun document ne sera collecté. Par exemple, le balayage de l'URL http://www.ibm.com/products avec le filtre d'URL */products/* ne générera aucun résultat car la règle comporte une barre oblique de fin mais pas l'URL. En revanche, le balayage de l'URL http://www.ibm.com/products/ avec le filtre d'URL */products/* (avec une barre oblique de fin dans les deux cas) et le balayage de l'URL http://www.ibm.com/products avec le filtre d'URL */products* (sans barre oblique de fin dans les deux cas) fonctionneront.
Pour plus d'informations sur les règles de filtrage et pour savoir comment les appliquer, voir le portlet Gérer la recherche et son aide.