OCR
Dieser Funktionsblock extrahiert gedruckten oder handschriftlichen Text aus einem Bild und liefert sowohl visuelle als auch textuelle Ergebnisse. Er ist einfach zu bedienen: Bild einspeisen, Empfindlichkeit anpassen und bei Bedarf Auto-Rotation oder Textüberlagerung aktivieren.
📥 Eingänge
ImageDieser Eingangsanschluss akzeptiert das Bild, aus dem Text gelesen werden soll.
📤 Ausgänge
ResultAnnotiertes Bild mit eingezeichneten Textboxen (sofern ein visueller Viewer verbunden ist).Whole TextAlle erkannten Texte zusammengefügt als ein einzelner String.TextsListe der erkannten Textstrings (mehrere Einträge möglich).BoxesErkannte Begrenzungsboxen für jede Textinstanz (Koordinaten).
🕹️ Steuerungen
Auto RotationUmschalter, damit der Block versucht, gedrehte oder auf dem Kopf stehende Texte zu lesen.Show TextsUmschalter, um erkannte Texte und Konfidenzwerte im annotierten Bild anzuzeigen.ThresholdSchieberegler, der die minimale Konfidenz festlegt, die für eine Erkennung akzeptiert wird (niedriger = mehr Ergebnisse, höher = weniger, dafür zuverlässigere Ergebnisse).
🎯 Funktionen
Echtzeit-Textextraktion aus eingespeisten Bildern.
Option zur automatischen Drehung, damit gedrehte oder auf dem Kopf stehende Texte erfasst werden.
Konfidenz-Schwellenwert zur Ausfilterung von Erkennungen mit niedriger Zuverlässigkeit.
Visuelle Ausgabe mit Begrenzungsrahmen und optionaler Textüberlagerung zur schnellen Überprüfung.
Strukturiertes Ausgabe-Format (Liste von Texten und Boxen) sowie ein zusammengeführter Text-Output für die Weiterverarbeitung.
⚙️ Ablauf
Wenn ein Bild an den Eingangsanschluss geliefert wird, läuft der OCR-Prozess und liefert:
ein annotiertes Bild auf
Result(sofern verbunden),den vollständigen erkannten Text auf
Whole Text,einzelne erkannte Strings auf
Texts,und die Begrenzungsbox-Koordinaten auf
Boxes.
Verwenden Sie Auto Rotation, um die Erkennung bei gedrehten Bildern zu verbessern. Mit Threshold können Sie Erkennungen mit geringer Konfidenz ausschließen.
📝 Nutzungshinweise
Verbinden Sie eine Bildquelle mit
Image(z. B. Kamera oder Image Loader).Aktivieren Sie
Auto Rotation, falls Ihre Bilder gedreht sein könnten.Stellen Sie den
Threshold-Schieberegler ein, um Recall und Präzision zu balancieren.Aktivieren Sie
Show Texts, wenn das annotierte Bild die erkannten Texte anzeigen soll.Lesen Sie die Ausgänge
Whole Text,TextsundBoxesfür Protokollierung oder nachgelagerte Verarbeitung aus.
💡 Tipps und Tricks
Für bessere OCR-Ergebnisse das Bild vorverarbeiten mit
Contrast OptimizationundBlur, um Rauschen zu reduzieren und den Zeichenkontrast zu verbessern.Wenn Sie nur einen bestimmten Bereich betrachten möchten, zuerst mit
Image ROI Selectzuschneiden und das zugeschnittene Bild in diesen Block einspeisen.Bei sehr großen Bildern
Image Resizerverwenden, um die Größe vor der OCR zu reduzieren und die Verarbeitung zu beschleunigen.Show Imagenutzen, um die annotierte Ausgabe während der Entwicklung schnell zu prüfen.Falls Sie eine alternative OCR-Engine bevorzugen, probieren Sie
OCR (EasyOCR)und vergleichen Sie die Ergebnisse.Erkannte Frames und Protokolle mit
Image Loggerspeichern für Offline-Überprüfung oder Audit-Trails.
Hinweis: Kombinieren Sie z. B. Image ROI Select, Image Resizer, Contrast Optimization, Blur, Show Image, Image Logger und OCR (EasyOCR) in Ihrem Flow, um Erkennungsqualität und Performance zu verbessern.
🛠️ Fehlersuche
Kein Text erkannt: Prüfen Sie, ob das Eingangsbild lesbaren Text enthält; erhöhen Sie den Kontrast oder verringern Sie den
Threshold.Rauschartige Ergebnisse (viele False Positives): Erhöhen Sie den
Threshold, um Erkennungen mit niedriger Konfidenz zu filtern.Gedrehte oder auf dem Kopf stehende Texte:
Auto Rotationaktivieren, bevor Sie denThresholderhöhen.Annotiertes Bild erscheint nicht: Stellen Sie sicher, dass ein Viewer verbunden ist oder verwenden Sie
Show Image, um die visuelle Ausgabe zu routen.
Zuletzt aktualisiert