Gestion des sources du contenu d'une collection de documents

Vous pouvez créer, afficher et mettre à jour des sources de contenu afin de personnaliser vos collections de recherche.

Les collections de recherche se composent d'une ou plusieurs sources de contenu. Utilisez le portlet Gérer la recherche pour gérer les sources de contenu d'une collection. To open the Manage Search portlet, click the Administration menu icon. Then, click Search Administration > Manage Search. Then, click Search Collections. Sélectionnez une collection de recherche en cliquant sur le lien de nom de collection. La fenêtre Sources de contenu s'ouvre.

A partir de la fenêtre Sources de contenu, vous pouvez gérer les sources de contenu en exécutant les tâches décrites ci-après.

Création d'une source de contenu

Créez une source de contenu dans la collection que vous avez sélectionnée en cliquant sur Nouvelle source de contenu. Pour obtenir des instructions détaillées, reportez-vous à Création d'une source de contenu.

Mise à jour d'une source de contenu

Cliquez sur Actualiser pour mettre à jour la liste de sources de contenu. Vous pouvez également afficher l'état de la collection sélectionnée, par exemple, le nombre de documents, l'heure d'exécution du dernier balayage et la planification de balayage.

Affichage et gestion des planificateurs

Cliquez sur Afficher les planificateurs de source de contenu pour afficher et gérer les planificateurs. Le portlet répertorie les balayages planifiés et les informations relatives aux date et heure de début, aux intervalles de répétition, aux date et heure de fin et au statut. Cette option est disponible uniquement si vous avez défini des planificaeurs pour la source de contenu.

Démarrage du balayage d'une source de contenu

Cliquez sur Démarrer le moteur de balayage pour lancer la collecte de documents et le balayage d'une source de contenu. Utilisez cette option pour mettre à jour une source de contenu en lançant une nouvelle exécution du moteur de balayage, ou pour arrêter cette mise à jour. Le délai d'attente que vous définissez dans les paramètres généraux pour le balayage d'une source de contenu fonctionne comme une limite de temps approximative. Elle peut être dépassée d'un certain pourcentage. Le délai d'attente ne fonctionne que pour les sources de contenu de site Web. Pour en savoir plus sur le balayage, lire Conseils et astuces pour les balayages du portail de recherche et Recherche et balayage sur le portail et d'autres sites.

Retrait et nouvelle collecte de documents

Cliquez sur Regrouper afin de retirer tous les documents précédemment collectés dans une source de contenu et d'initier un processus de balayage complet afin de collecter de nouveaux documents.

Vérification d'une adresse de source de contenu

Cliquez sur Vérifier adresse pour vérifier que l'adresse de la source de contenu est correcte. Si la source de contenu Web est disponible et non bloquée par un fichier robots.text, le portlet Gérer la recherche renvoie un message indiquant que la
source de contenu est OK
. Si la source de contenu n'est pas valide, si elle inaccessible ou bloquée, le portlet Gestion des recherches renvoie un message d'erreur. Lorsque vous créez une nouvelle source de contenu, le portlet Gestion des ressources démarre la fonction Vérifier l'adresse.

Configuration d'une source de contenu

Cliquez sur Editer pour configurer des paramètres généraux, des paramètres avancés, des planificateurs et des options de sécurité.

Suppression d'une source de contenu

Cliquez sur Supprimer pour retirer une source de contenu de la collection de recherche. Les documents qui ont été collectés à partir de cette source de contenu restent disponibles pour la recherche jusqu'à ce qu'elle arrivent à expiration. Vous pouvez préciser cette date d'expiration dans Les liens expirent après (jours) : sur l'onglet Paramètres généraux, lorsque vous créez une source de contenu.