I think I found the issue (and solution) to it, however. I am using regex for extracting the VIN, which is fed as feature into the CRF. I also learned that lookaheads can be used to check for smaller phrases - in this case at least one character and one number. By changing the regex accordingly the problem didn’t occur again and training proceeded correctly.
This leaves the question how it can be, that the CRF blocks itself when extracting two different entities - by choosing the highest percentage the choice would have been right in both cases.
## intent:Fehler
- der [listenpreis](Falschwert) der Ordernummer [4712783](ordernummer) ist falsch
- [listenpreis](Falschwert) von VIN [KJ678TS](vin) passt ned
- Der Preis für Ordernummer [1324027](ordernummer) ist falsch
- der [listenpreis](Falschwert:listenpreis) mit ordernummer [8982782](ordernummer) ist nicht sauber
- Der [Listenpreis](Falschwert:listenpreis) von [12345607](ordernummer) ist inkorrekt
- [Listenpreos](Falschwert:listenpreis)
- [listenpreos](Falschwert:listenpreis)
##intent: inform
- [ZY27671](vin)
- [C160305](vin)
- [C291143](vin)
- [KL10765](vin)
- [31774](ordernummer)
- [45006](ordernummer)
- [36252](ordernummer)
- [81578](ordernummer)
- [032683](ordernummer)