Rasa case sensitivity

Dear all,

Hope you are doing well! I need your opinion for rasa case sensitivity.

I have created a french model using this config.

language: fr_core_news_lg

pipeline:

  • name: WhitespaceTokenizer token_pattern: (?u)\b\w+\b case_sensitive: False
  • name: LexicalSyntacticFeaturizer
  • name: CRFEntityExtractor
  • name: EntitySynonymMapper
  • name: CountVectorsFeaturizer max_ngram: 4 min_ngram: 1 analyzer: “word” stop_words: [‘j’, ‘je’, ‘entre’, ‘veux’, ‘souhaite’, ‘savoir’, ‘voudrais’, ‘il’, ‘elle’, ‘aimerai’, ‘aimerais’, ‘devrais’, ‘pourrais’, ‘vais’, ‘est-ce’, ‘est-elle’, ‘est-il’, ‘brad’,‘saurais’, ‘combien’, ‘après’,‘aime’,‘alors’,‘au’,‘aucuns’,‘aussi’,‘autre’,‘avant’,‘avec’,‘avoir’,‘bon’,‘car’,‘ce’,‘cela’,‘ces’,‘ceux’,‘chaque’,‘ci’,‘comme’,‘comment’,‘des’,‘du’,‘dedans’,‘dehors’,‘depuis’,‘devrait’,‘doit’,‘donc’,‘dos’,‘début’,‘elles’,‘en’,‘encore’,‘essai’,‘est’,‘et’,‘eu’,‘fait’,‘faites’,‘fois’,‘font’,‘hors’,‘ici’,‘ils’,‘juste’,‘la’,‘le’,‘les’,‘leurs’,‘là’,‘ma’,‘maintenant’,‘mais’,‘mes’,‘mien’,‘moins’,‘mon’,‘même’,‘ni’,‘notre’,‘nous’,‘ou’,‘où’,‘par’,‘parce’,‘peu’,‘plupart’,‘pour’,‘pourquoi’,‘quand’,‘que’,‘quel’,‘quelle’,‘quels’,‘quelles’,‘qui’,‘sa’,‘sans’,‘ses’,‘seulement’,‘si’,‘sien’,‘sont’,‘son’,‘sous’,‘soyez’,‘sur’,‘ta’,‘tandis’,‘tellement’,‘tels’,‘tes’,‘ton’,‘tous’,‘tout’,‘trop’,‘très’,‘tu’,‘voient’,‘vont’,‘votre’,‘vous’,‘vu’,‘ça’,‘étaient’,‘été’,‘être’,‘a’, ‘à’, ‘pouvez’, ‘suis’, ‘au’, ‘aux’, ‘avec’, ‘ce’, ‘ces’, ‘dans’, ‘de’, ‘des’, ‘du’, ‘elle’, ‘en’, ‘et’, ‘eux’, ‘il’, ‘ils’, ‘je’, ‘la’, ‘le’, ‘les’, ‘leur’, ‘lui’, ‘ma’, ‘mais’, ‘me’, ‘même’, ‘mes’, ‘moi’, ‘mon’, ‘nos’, ‘notre’, ‘nous’, ‘on’, ‘ou’, ‘par’, ‘qu’, ‘qui’, ‘sa’, ‘se’, ‘ses’, ‘son’, ‘sur’, ‘ta’, ‘te’, ‘tes’, ‘toi’, ‘ton’, ‘tu’, ‘un’, ‘une’, ‘vos’, ‘votre’, ‘vous’, ‘été’, ‘étée’, ‘étées’, ‘étés’, ‘étant’, ‘étante’, ‘étants’, ‘étantes’, ‘suis’, ‘es’, ‘est’, ‘sommes’, ‘êtes’, ‘sont’, ‘serai’, ‘seras’, ‘sera’, ‘serons’, ‘serez’, ‘seront’, ‘serais’, ‘serait’, ‘serions’, ‘seriez’, ‘seraient’, ‘étais’, ‘était’, ‘étions’, ‘étiez’, ‘étaient’, ‘fus’, ‘fut’, ‘fûmes’, ‘fûtes’, ‘furent’, ‘sois’, ‘soit’, ‘soyons’, ‘soyez’, ‘soient’, ‘fusse’, ‘fusses’, ‘fût’, ‘fussions’, ‘fussiez’, ‘fussent’, ‘ayant’, ‘ayante’, ‘ayantes’, ‘ayants’, ‘eu’, ‘eue’, ‘eues’, ‘eus’, ‘ai’, ‘as’, ‘avons’, ‘avez’, ‘ont’, ‘aurai’, ‘auras’, ‘aura’, ‘aurons’, ‘aurez’, ‘auront’, ‘aurais’, ‘aurait’, ‘aurions’, ‘auriez’, ‘auraient’, ‘avais’, ‘avait’, ‘avions’, ‘aviez’, ‘avaient’, ‘eut’, ‘eûmes’, ‘eûtes’, ‘eurent’, ‘aie’, ‘aies’, ‘ait’, ‘ayons’, ‘ayez’, ‘aient’, ‘eusse’, ‘eusses’, ‘eût’, ‘eussions’, ‘eussiez’, ‘eussent’, ‘aimer’, ‘vouloir’, ‘quoi’, ‘pouvoir’, ‘devoir’, ‘chez’, ‘svp’, ‘stp’, ‘pense’ ,‘parmi’, ‘ceci’, ‘etant’, ‘parceque’, ‘tiens’, ‘celui’, ‘là’, ‘sait’, ‘via’, ‘voilà’, ‘sinon’, ‘suivant’, ‘pu’, ‘auprès’, ‘soi’, ‘même’, ‘etais’, ‘celle’, ‘ci’, ‘donc’, ‘alors’, ‘depuis’, ‘soit’, ‘soient’, ‘près’, ‘puis’, ‘ai’]
  • name: DIETClassifier epochs: 300 ranking_length: 5 entity_recognition: False
    RANDOM_SEED: 7777777
  • name: FallbackClassifier threshold: 0.75

policies:

  • name: RulePolicy core_fallback_threshold: 0.3 core_fallback_action_name: ‘action_default_fallback’ enable_fallback_prediction: True

So i have used case sensitivity=False

when testing the modele! i have remarked that uppercase and lowercase may impact the accuracy. Below is an example

Object

text: “je cherche une Attestation”

intent: Object

name: “Mutual_Attestation”

confidence: 0.7943859696388245

text: “je cherche une attestation”

intent: Object

name: “nlu_fallback”

confidence: 0.75

How can i please solve this kind of problem ?

thanks for helping

Any help please ?