OCR

Dieser Funktionsblock extrahiert gedruckten oder handschriftlichen Text aus einem Bild und liefert sowohl visuelle als auch textuelle Ergebnisse. Er ist einfach zu bedienen: Bild einspeisen, Empfindlichkeit anpassen und bei Bedarf Auto-Rotation oder Textüberlagerung aktivieren.

📥 Eingänge

  • Image Dieser Eingangsanschluss akzeptiert das Bild, aus dem Text gelesen werden soll.

📤 Ausgänge

  • Result Annotiertes Bild mit eingezeichneten Textboxen (sofern ein visueller Viewer verbunden ist).

  • Whole Text Alle erkannten Texte zusammengefügt als ein einzelner String.

  • Texts Liste der erkannten Textstrings (mehrere Einträge möglich).

  • Boxes Erkannte Begrenzungsboxen für jede Textinstanz (Koordinaten).

🕹️ Steuerungen

  • Auto Rotation Umschalter, damit der Block versucht, gedrehte oder auf dem Kopf stehende Texte zu lesen.

  • Show Texts Umschalter, um erkannte Texte und Konfidenzwerte im annotierten Bild anzuzeigen.

  • Threshold Schieberegler, der die minimale Konfidenz festlegt, die für eine Erkennung akzeptiert wird (niedriger = mehr Ergebnisse, höher = weniger, dafür zuverlässigere Ergebnisse).

🎯 Funktionen

  • Echtzeit-Textextraktion aus eingespeisten Bildern.

  • Option zur automatischen Drehung, damit gedrehte oder auf dem Kopf stehende Texte erfasst werden.

  • Konfidenz-Schwellenwert zur Ausfilterung von Erkennungen mit niedriger Zuverlässigkeit.

  • Visuelle Ausgabe mit Begrenzungsrahmen und optionaler Textüberlagerung zur schnellen Überprüfung.

  • Strukturiertes Ausgabe-Format (Liste von Texten und Boxen) sowie ein zusammengeführter Text-Output für die Weiterverarbeitung.

⚙️ Ablauf

Wenn ein Bild an den Eingangsanschluss geliefert wird, läuft der OCR-Prozess und liefert:

  • ein annotiertes Bild auf Result (sofern verbunden),

  • den vollständigen erkannten Text auf Whole Text,

  • einzelne erkannte Strings auf Texts,

  • und die Begrenzungsbox-Koordinaten auf Boxes.

Verwenden Sie Auto Rotation, um die Erkennung bei gedrehten Bildern zu verbessern. Mit Threshold können Sie Erkennungen mit geringer Konfidenz ausschließen.

📝 Nutzungshinweise

  1. Verbinden Sie eine Bildquelle mit Image (z. B. Kamera oder Image Loader).

  2. Aktivieren Sie Auto Rotation, falls Ihre Bilder gedreht sein könnten.

  3. Stellen Sie den Threshold-Schieberegler ein, um Recall und Präzision zu balancieren.

  4. Aktivieren Sie Show Texts, wenn das annotierte Bild die erkannten Texte anzeigen soll.

  5. Lesen Sie die Ausgänge Whole Text, Texts und Boxes für Protokollierung oder nachgelagerte Verarbeitung aus.

💡 Tipps und Tricks

  • Für bessere OCR-Ergebnisse das Bild vorverarbeiten mit Contrast Optimization und Blur, um Rauschen zu reduzieren und den Zeichenkontrast zu verbessern.

  • Wenn Sie nur einen bestimmten Bereich betrachten möchten, zuerst mit Image ROI Select zuschneiden und das zugeschnittene Bild in diesen Block einspeisen.

  • Bei sehr großen Bildern Image Resizer verwenden, um die Größe vor der OCR zu reduzieren und die Verarbeitung zu beschleunigen.

  • Show Image nutzen, um die annotierte Ausgabe während der Entwicklung schnell zu prüfen.

  • Falls Sie eine alternative OCR-Engine bevorzugen, probieren Sie OCR (EasyOCR) und vergleichen Sie die Ergebnisse.

  • Erkannte Frames und Protokolle mit Image Logger speichern für Offline-Überprüfung oder Audit-Trails.

Hinweis: Kombinieren Sie z. B. Image ROI Select, Image Resizer, Contrast Optimization, Blur, Show Image, Image Logger und OCR (EasyOCR) in Ihrem Flow, um Erkennungsqualität und Performance zu verbessern.

🛠️ Fehlersuche

  • Kein Text erkannt: Prüfen Sie, ob das Eingangsbild lesbaren Text enthält; erhöhen Sie den Kontrast oder verringern Sie den Threshold.

  • Rauschartige Ergebnisse (viele False Positives): Erhöhen Sie den Threshold, um Erkennungen mit niedriger Konfidenz zu filtern.

  • Gedrehte oder auf dem Kopf stehende Texte: Auto Rotation aktivieren, bevor Sie den Threshold erhöhen.

  • Annotiertes Bild erscheint nicht: Stellen Sie sicher, dass ein Viewer verbunden ist oder verwenden Sie Show Image, um die visuelle Ausgabe zu routen.

Zuletzt aktualisiert