Ajout de balises de catégorie grammaticale
Les jetons de recherche sont étiquetés en fonction de leur catégorie grammaticale (POS). Par exemple, "sofa" est généralement étiqueté comme nom. Les termes qui ne sont pas étiquetés comme type reconnu seront ignorés, mais vous pouvez étendre la logique de catégorie grammaticale pour prendre en charge de nouveaux types.
Traitement des catégories grammaticales
"name": "NLPPOSCodes",
"property": [
{
"name" : "NOUN_CODE",
"value" : "NN,NNS,NNS,NNPS,NOUN,NE"
},
{
"name" : "VERB_CODE",
"value" : "VB,VBD,VBG,VBN,VBP,VBZ,VERB,VMFIN,VVINF,VVFIN,VV"
},
{
"name" : "ADJECTIVE_CODE",
"value" : "DT,PDT,JJ,JJR,JJS,ADJ,ADJA,ADJD"
},
{
"name" : "NUMERIC_CODE",
"value" : "CD,CARD,NUM,NFP"
Lorsque votre chaîne de recherche inclut le jeton "canapé", par exemple, CoreNLP annote ce jeton avec la balise POS de NN (Nom).- Les recherches de noms sont effectuées sur
natural.nouns.normalizedetnatural.nouns.rawdans l'index. - Les recherches d'adjectifs seront effectuées sur
natural.adjectives.normalizedetnatural.adjectives.rawdans l'index. - Les codes numériques sont utilisés en fonction du terme de recherche d'entrée identifié par le matchmaker, puis par
natural.*.measurements, sinon la recherche se basera surnatural.adjectives.normalizedetnatural.adjectives.rawdans l'index. - Tous les jetons de recherche annotés avec une balise de verbe seront ignorés lors de la recherche.
La chaîne de jeton peut contenir plusieurs types de balise. Les quatre types de balises les plus courants seront tous reconnus par les processeurs ci-dessus. Les balises qui ne sont pas de ces types seront ignorées. Dans le cas de la chaîne de recherche "bonjour à tous", "bonjour" sera étiqueté comme UH, tandis que "tous" sera étiqueté comme NN. UH n'est pas l'un des types répertoriés pour le nom, l'adjectif, les valeurs numériques ou les verbes. Par conséquent, seul "tous" participera à la recherche.
PATCH http://dataQueryHost:dataQueryPort/search/resources/api/v2/configuration?nodeName=component&envType=auth{
"extendedconfiguration": {
"configgrouping": [
{
"name": "NLPPOSCodes",
"property": [
{
"name": "NOUN_CODE",
"value": "NN,NNS,NNS,NNPS,NOUN,NE,UH"
}
]
}
]
}
}