Identification du client pour une exploration du portail par des moteurs de recherche externes

Pour que le portail puisse reconnaître les moteurs de recherche externes, il utilise un client prenant en charge plusieurs moteurs de recherche courants. Ce client est mis en œuvre selon la norme CC/PP (Composite Capability/Preference Profiles). La fonction HTML_SEARCH est définie pour ce client. Si vous voulez ajouter d'autres moteurs de recherche, vous pouvez configurer le client en conséquence.

Paramètres client

Le client a été mis en œuvre avec les paramètres suivants :
Agent utilisateur :
(.*(B|b)ot.*)|(.*BOT.*)|(.*(S|s)pider.*)|(.*(S|s)earch.*)|(.*(C|c)rawl(er)?.*)|(.*(G|g)rabber.*)|(.*(Y|y)ahoo.*)|(.*(S|s)lurp.*)|(.*Lycos.*)|(.*Wget.*)

Cet agent d'utilisateur couvre la majeure partie des grands moteurs de recherche disponibles, tels que Google, Yahoo!, Lycos, ou MSN. Cette liste de schémas prend également en charge tous les autres moteurs de recherche qui incluent des segments de bot, spider, search ou crawler.

Fonction :
Vous devez définir la fonction HTML_SEARCH pour chaque moteur de recherche que vous voulez autoriser à explorer votre portail. Les moteurs de recherche accèdent généralement deux fois à un site Web, une première fois pour l'explorer et une deuxième fois pour valider le contenu. Lorsqu'un moteur de recherche accède à un site pour la deuxième fois, il le fait en général en utilisant un navigateur normal. C'est pourquoi, il est nécessaire d'entrer des fonctions complémentaires pour la prise en charge des paramètres de navigateur. Exemples : (HTML_4_0, HTML_IFRAME, HTML_FRAME, HTML_NESTED_TABLE, HTML_2_0, HTML_JAVASCRIPT, HTML_3_2, HTML_3_0, HTML_CSS, HTML_TABLE).
Fabricant :
Rechercher
Marquage :
HTML
Si vous voulez inclure des moteurs de recherche non pris en charge par l'ensemble par défaut, vous pouvez le faire à l'aide du portlet d'administration Gestion des clients ou de l'interface de configuration XML. Pour plus d'informations, voir les rubriques suivantes.
Notes :
  1. Le mécanisme de recherche fonctionne correctement pour le portail uniquement si les robots des moteurs de recherche ont été préalablement identifiés par le portail.
  2. Les recherches effectuées par des moteurs de recherche externes sur votre portail requièrent, outre l'identification du client, une configuration supplémentaire. Pour plus de détails, consultez les rubriques Configuration de votre site de portail pour permettre la recherche par des services externes et Configuration du portlet de recherche dans le plan du site pour permettre les recherches par des moteurs de recherche externes.