Dear all,
Hope you are doing well! I need your opinion for rasa case sensitivity.
I have created a french model using this config.
language: fr_core_news_lg
pipeline:
- name: WhitespaceTokenizer token_pattern: (?u)\b\w+\b case_sensitive: False
- name: LexicalSyntacticFeaturizer
- name: CRFEntityExtractor
- name: EntitySynonymMapper
- name: CountVectorsFeaturizer max_ngram: 4 min_ngram: 1 analyzer: “word” stop_words: [‘j’, ‘je’, ‘entre’, ‘veux’, ‘souhaite’, ‘savoir’, ‘voudrais’, ‘il’, ‘elle’, ‘aimerai’, ‘aimerais’, ‘devrais’, ‘pourrais’, ‘vais’, ‘est-ce’, ‘est-elle’, ‘est-il’, ‘brad’,‘saurais’, ‘combien’, ‘après’,‘aime’,‘alors’,‘au’,‘aucuns’,‘aussi’,‘autre’,‘avant’,‘avec’,‘avoir’,‘bon’,‘car’,‘ce’,‘cela’,‘ces’,‘ceux’,‘chaque’,‘ci’,‘comme’,‘comment’,‘des’,‘du’,‘dedans’,‘dehors’,‘depuis’,‘devrait’,‘doit’,‘donc’,‘dos’,‘début’,‘elles’,‘en’,‘encore’,‘essai’,‘est’,‘et’,‘eu’,‘fait’,‘faites’,‘fois’,‘font’,‘hors’,‘ici’,‘ils’,‘juste’,‘la’,‘le’,‘les’,‘leurs’,‘là’,‘ma’,‘maintenant’,‘mais’,‘mes’,‘mien’,‘moins’,‘mon’,‘même’,‘ni’,‘notre’,‘nous’,‘ou’,‘où’,‘par’,‘parce’,‘peu’,‘plupart’,‘pour’,‘pourquoi’,‘quand’,‘que’,‘quel’,‘quelle’,‘quels’,‘quelles’,‘qui’,‘sa’,‘sans’,‘ses’,‘seulement’,‘si’,‘sien’,‘sont’,‘son’,‘sous’,‘soyez’,‘sur’,‘ta’,‘tandis’,‘tellement’,‘tels’,‘tes’,‘ton’,‘tous’,‘tout’,‘trop’,‘très’,‘tu’,‘voient’,‘vont’,‘votre’,‘vous’,‘vu’,‘ça’,‘étaient’,‘été’,‘être’,‘a’, ‘à’, ‘pouvez’, ‘suis’, ‘au’, ‘aux’, ‘avec’, ‘ce’, ‘ces’, ‘dans’, ‘de’, ‘des’, ‘du’, ‘elle’, ‘en’, ‘et’, ‘eux’, ‘il’, ‘ils’, ‘je’, ‘la’, ‘le’, ‘les’, ‘leur’, ‘lui’, ‘ma’, ‘mais’, ‘me’, ‘même’, ‘mes’, ‘moi’, ‘mon’, ‘nos’, ‘notre’, ‘nous’, ‘on’, ‘ou’, ‘par’, ‘qu’, ‘qui’, ‘sa’, ‘se’, ‘ses’, ‘son’, ‘sur’, ‘ta’, ‘te’, ‘tes’, ‘toi’, ‘ton’, ‘tu’, ‘un’, ‘une’, ‘vos’, ‘votre’, ‘vous’, ‘été’, ‘étée’, ‘étées’, ‘étés’, ‘étant’, ‘étante’, ‘étants’, ‘étantes’, ‘suis’, ‘es’, ‘est’, ‘sommes’, ‘êtes’, ‘sont’, ‘serai’, ‘seras’, ‘sera’, ‘serons’, ‘serez’, ‘seront’, ‘serais’, ‘serait’, ‘serions’, ‘seriez’, ‘seraient’, ‘étais’, ‘était’, ‘étions’, ‘étiez’, ‘étaient’, ‘fus’, ‘fut’, ‘fûmes’, ‘fûtes’, ‘furent’, ‘sois’, ‘soit’, ‘soyons’, ‘soyez’, ‘soient’, ‘fusse’, ‘fusses’, ‘fût’, ‘fussions’, ‘fussiez’, ‘fussent’, ‘ayant’, ‘ayante’, ‘ayantes’, ‘ayants’, ‘eu’, ‘eue’, ‘eues’, ‘eus’, ‘ai’, ‘as’, ‘avons’, ‘avez’, ‘ont’, ‘aurai’, ‘auras’, ‘aura’, ‘aurons’, ‘aurez’, ‘auront’, ‘aurais’, ‘aurait’, ‘aurions’, ‘auriez’, ‘auraient’, ‘avais’, ‘avait’, ‘avions’, ‘aviez’, ‘avaient’, ‘eut’, ‘eûmes’, ‘eûtes’, ‘eurent’, ‘aie’, ‘aies’, ‘ait’, ‘ayons’, ‘ayez’, ‘aient’, ‘eusse’, ‘eusses’, ‘eût’, ‘eussions’, ‘eussiez’, ‘eussent’, ‘aimer’, ‘vouloir’, ‘quoi’, ‘pouvoir’, ‘devoir’, ‘chez’, ‘svp’, ‘stp’, ‘pense’ ,‘parmi’, ‘ceci’, ‘etant’, ‘parceque’, ‘tiens’, ‘celui’, ‘là’, ‘sait’, ‘via’, ‘voilà’, ‘sinon’, ‘suivant’, ‘pu’, ‘auprès’, ‘soi’, ‘même’, ‘etais’, ‘celle’, ‘ci’, ‘donc’, ‘alors’, ‘depuis’, ‘soit’, ‘soient’, ‘près’, ‘puis’, ‘ai’]
- name: DIETClassifier
epochs: 300
ranking_length: 5
entity_recognition: False
RANDOM_SEED: 7777777 - name: FallbackClassifier threshold: 0.75
policies:
- name: RulePolicy core_fallback_threshold: 0.3 core_fallback_action_name: ‘action_default_fallback’ enable_fallback_prediction: True
So i have used case sensitivity=False
when testing the modele! i have remarked that uppercase and lowercase may impact the accuracy. Below is an example
Object
text: “je cherche une Attestation”
intent: Object
name: “Mutual_Attestation”
confidence: 0.7943859696388245
text: “je cherche une attestation”
intent: Object
name: “nlu_fallback”
confidence: 0.75
How can i please solve this kind of problem ?
thanks for helping