pytesseract OCR mit einzelnen Ziffernerkennung und nur Zahlenbeschränkungen
im Kontext der Pytesseract, konfigurieren Tesseract, um einzelne Ziffern zu erkennen und die Ausgaben zu zahlen, um die Ausgaben auf Zahlen zu ermitteln. Um dieses Problem anzugehen, befassen wir uns mit den Einzelheiten der Konfigurationsoptionen von Tesseract.
tesseract Page Segmentierungsmodi
tesseract bieten verschiedene Seitensegmentierungsmodi (PSM), um verschiedene Textlayouts zu verarbeiten. Für die Erkennung einer einzelnen Zeichen ist das entsprechende PSM 10. Dieser Modus behandelt das Bild als einzelnes Zeichen.
Zeichen whitelist
, um die anerkannten Zeichen auf Zahlen zu beschränken, können wir den Parameter Tegesit_chitelistkonfiguration nutzen. Durch Angeben von 0123456789 als Whitelist akzeptiert Tesseract nur diese Zeichen.
mast useage
Hier sind ein Beispiel verwendet. Boxen = falsch, config = '-PSM 10-OEM 3 -c Tessedit_char_whitelist = 0123456789')
target = pytesseract.image_to_string(image, lang='eng', boxes=False, config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3