Text Detection

Dieser Funktionsblock findet Textbereiche in einem Bild und visualisiert sie. Er ist auf die Erkennung orientierter Textfelder (gedreht oder geneigt) abgestimmt und liefert sowohl ein Vorschaubild als auch strukturierte Positionsdaten zur weiteren Verarbeitung.

📥 Eingänge

Image Any — Eingabebild, das auf Text analysiert werden soll.

📤 Ausgänge

Image Any — Annotiertes Bild mit eingezeichneten erkannten Textbereichen.

Referance Point — Liste der Referenzpunkte (Eckpunkte) für jeden erkannten Textbereich.

Referance Rectangles — Liste der Begrenzungsrechtecke für jeden erkannten Textbereich.

Number of Detected Text — Gesamte Anzahl der gefundenen Textbereiche.

🕹️ Steuerungen

Confidence — Legt die minimale Konfidenz fest, die eine Erkennung haben muss, um akzeptiert zu werden. Höhere Werte reduzieren Fehlalarme, können aber schwach sichtbaren Text übersehen.

NMS Threshold — Steuert, wie stark sich überlappende Erkennungen zusammengeführt werden. Niedrigere Werte führen zu strengerem Zusammenführen und reduzieren doppelte Boxen über demselben Text.

⚙️ Ausführungsmechanismus

Beim Ausführen durchsucht der Block das übergebene Bild nach Regionen, die wie Text aussehen, filtert die Ergebnisse nach Confidence, führt überlappende Erkennungen zusammen (NMS) und skaliert gefundene Regionen zurück auf die Größe des Eingabebildes. Als Ergebnis werden ein annotiertes Vorschaubild, Listen mit Referenzpunkten und Rechtecken für jede Erkennung sowie die Gesamtanzahl der erkannten Textbereiche ausgegeben.

🎯 Funktionen

  • Erkennt gedrehte und geneigte Textregionen, nicht nur horizontale Zeilen.

  • Liefert sowohl visuelles Feedback (annotiertes Bild) als auch strukturierte Ausgaben (Punkte, Rechtecke, Anzahl) zur Weiterverarbeitung.

  • Einstellbare Empfindlichkeit über Confidence und NMS Threshold, um Präzision vs. Trefferquote zu balancieren.

📝 Nutzungshinweise

  1. Stellen Sie ein Bild an den Eingang Image Any (Kamera, Dateilader oder Stream).

  2. Passen Sie den Confidence-Regler an, um Fehlalarme gegen verpasste Texte abzuwägen.

  3. Bei mehreren überlappenden Boxen den NMS Threshold anpassen, um Duplikate zu reduzieren.

  4. Nutzen Sie das annotierte Image Any-Output zur Vorschau und Referance Point / Referance Rectangles, um Bereiche zuzuschneiden, zu extrahieren oder an Erkennungsblöcke weiterzugeben.

💡 Tipps und Tricks

  • Bei sehr großen Bildern zuerst Image Resizer verwenden, um die Verarbeitung zu beschleunigen, und ggf. die Rechteckkoordinaten wieder auf das Originalbild zurückrechnen.

  • Für anschließende Texterkennung die gefundenen Ausschnitte an OCR oder OCR (EasyOCR) anschließen.

  • Um sich auf einen bestimmten Bereich zu konzentrieren, zunächst mit Image ROI oder Image ROI Select zuschneiden und das zugeschnittene Bild in diesen Block einspeisen.

  • Show Image zur Vorschau verwenden und mit Draw Result On Image benutzerdefinierte Statustexte über die Erkennung legen.

  • Ergebnisse mit Image Write speichern oder Beispiele mit Image Logger für spätere Überprüfung protokollieren.

🛠️ Fehlersuche

  • Keine Erkennungen: Confidence reduzieren oder ein klareres Objektbild verwenden.

  • Zu viele kleine Boxen oder Duplikate: Confidence erhöhen und NMS Threshold verringern, um überlappende Erkennungen zusammenzuführen.

  • Falsche Positionen nach Skalierung: Stellen Sie sicher, dass alle Resize-Schritte bei der Interpretation von Referance Rectangles berücksichtigt werden.

  • Nur erkannter Text (keine Positionen) benötigt: Block an OCR / OCR (EasyOCR) anschließen und die Zähler-Ausgabe (Number of Detected Text) zur Steuerung der weiteren Logik nutzen.

Zuletzt aktualisiert