Why is tokenization needed before a LanguageModelFeaturizer?

Charles (C G) April 11, 2023, 8:00am 1

I cannot understand this especially when BERT is used for the LanguageModelFeaturizer. The input of BERT has no need to be tokenized after all. Is this for NER?

Topic		Replies	Views
Purpose of Tokenizer when using LanguageModelFeaturizer Rasa Open Source	5	1369	November 19, 2021
Correct tokenizer for BERT Rasa/LaBSE Rasa Open Source	2	266	January 17, 2025
Hugging Face custom Tokenizer Rasa Open Source	2	336	March 26, 2024
LanguageModelFeaturizer in pipeline dont work! Rasa Open Source	2	687	May 12, 2022
LanguageModelFeaturizer.py token has to attribute text, no attribute set Rasa Open Source	0	198	May 17, 2021

Why is tokenization needed before a LanguageModelFeaturizer?

Related topics