Gestion des caractères spéciaux par Recherche de portail, lors de l'indexation

La Recherche de portail indexe des mots composés de caractères consécutifs, tels que lettres, chiffres et caractères spéciaux. Découvrez comment la Recherche de portail traite les caractères spéciaux lors de l'indexation.

Ceci comprend les caractères suivants :
  • Le signe dièse (#).
  • Le signe pourcentage (%).
  • Le signe plus (+).
  • L'astérisque (*).
Pendant l'indexation, les caractères spéciaux sont traités comme suit :
Blanc ou espace (tabulation comprise)
Les espaces séparent les mots et ne sont pas indexés. Exemple : la chaîne key board est indexée comme deux mots séparés key et board.
Fin de ligne ou ligne suivante
Une fin de ligne est une séparation de mots et n'est pas indexée, à moins d'être précédée d'un tiret (-). Exemples :
  • La chaîne
    key 
    board
    est indexée comme deux mots séparés key et board.
  • La chaîne
    key-
    board
    est indexée comme un seul mot keyboard.
Point ou point final d'une phrase ( . ) et virgule ( , )
Les points et virgules séparent les mots et ne sont pas indexés, à moins d'être précédés et suivis d'une lettre ou d'un chiffre. Exemple : la chaîne www.ibm.com est indexée comme www.ibm.com et non comme trois mots séparés.
Point d'interrogation ( ? ) et point d'exclamation ( ! )
Les points d'interrogation et d'exclamation séparent les mots et ne sont pas indexés, à moins d'être suivis d'une lettre.
Autres signes de ponctuation : ( ) { } [ ] < > ; : / \ | " _ -
Ces caractères séparent les mots et ne sont pas indexés.
Autres caractères
Tous les autres caractères sont supprimés des chaînes dans lesquelles ils apparaissent, mais ne séparent pas les mots.
Notes :
  1. Tous les caractères de coupure de mot sont ignorés pendant l'indexation et la recherche.
  2. Les instructions précédentes s'appliquent à l'indexation. Toutefois, dans une requête de recherche tous les caractères pouvant faire partie de la syntaxe sont traités en tant que tel, et pas comme partie de la requête de recherche. Il s'agit des signes plus ( + ) et moins ( - ), des guillemets doubles ( " ) et du caractère générique astérisque ( * ). Pour inclure ces caractères dans un requête de recherche, il faut les mettre entre guillemets doubles. Par exemple, "+hello" recherche la chaîne +hello ; "*Hello*" recherche la chaîne *Hello*.
  3. Les symboles inférieur à ( < ) and greater than ( > ) sont des caractères HTML spéciaux qui ne sont pas gérés par la recherche.