Text Detection
Dieser Funktionsblock findet Textbereiche in einem Bild und visualisiert sie. Er ist auf die Erkennung orientierter Textfelder (gedreht oder geneigt) abgestimmt und liefert sowohl ein Vorschaubild als auch strukturierte Positionsdaten zur weiteren Verarbeitung.
📥 Eingänge
Image Any — Eingabebild, das auf Text analysiert werden soll.
📤 Ausgänge
Image Any — Annotiertes Bild mit eingezeichneten erkannten Textbereichen.
Referance Point — Liste der Referenzpunkte (Eckpunkte) für jeden erkannten Textbereich.
Referance Rectangles — Liste der Begrenzungsrechtecke für jeden erkannten Textbereich.
Number of Detected Text — Gesamte Anzahl der gefundenen Textbereiche.
🕹️ Steuerungen
Confidence — Legt die minimale Konfidenz fest, die eine Erkennung haben muss, um akzeptiert zu werden. Höhere Werte reduzieren Fehlalarme, können aber schwach sichtbaren Text übersehen.
NMS Threshold — Steuert, wie stark sich überlappende Erkennungen zusammengeführt werden. Niedrigere Werte führen zu strengerem Zusammenführen und reduzieren doppelte Boxen über demselben Text.
⚙️ Ausführungsmechanismus
Beim Ausführen durchsucht der Block das übergebene Bild nach Regionen, die wie Text aussehen, filtert die Ergebnisse nach Confidence, führt überlappende Erkennungen zusammen (NMS) und skaliert gefundene Regionen zurück auf die Größe des Eingabebildes. Als Ergebnis werden ein annotiertes Vorschaubild, Listen mit Referenzpunkten und Rechtecken für jede Erkennung sowie die Gesamtanzahl der erkannten Textbereiche ausgegeben.
🎯 Funktionen
Erkennt gedrehte und geneigte Textregionen, nicht nur horizontale Zeilen.
Liefert sowohl visuelles Feedback (annotiertes Bild) als auch strukturierte Ausgaben (Punkte, Rechtecke, Anzahl) zur Weiterverarbeitung.
Einstellbare Empfindlichkeit über
ConfidenceundNMS Threshold, um Präzision vs. Trefferquote zu balancieren.
📝 Nutzungshinweise
Stellen Sie ein Bild an den Eingang
Image Any(Kamera, Dateilader oder Stream).Passen Sie den
Confidence-Regler an, um Fehlalarme gegen verpasste Texte abzuwägen.Bei mehreren überlappenden Boxen den
NMS Thresholdanpassen, um Duplikate zu reduzieren.Nutzen Sie das annotierte
Image Any-Output zur Vorschau undReferance Point/Referance Rectangles, um Bereiche zuzuschneiden, zu extrahieren oder an Erkennungsblöcke weiterzugeben.
💡 Tipps und Tricks
Bei sehr großen Bildern zuerst
Image Resizerverwenden, um die Verarbeitung zu beschleunigen, und ggf. die Rechteckkoordinaten wieder auf das Originalbild zurückrechnen.Für anschließende Texterkennung die gefundenen Ausschnitte an
OCRoderOCR (EasyOCR)anschließen.Um sich auf einen bestimmten Bereich zu konzentrieren, zunächst mit
Image ROIoderImage ROI Selectzuschneiden und das zugeschnittene Bild in diesen Block einspeisen.Show Imagezur Vorschau verwenden und mitDraw Result On Imagebenutzerdefinierte Statustexte über die Erkennung legen.Ergebnisse mit
Image Writespeichern oder Beispiele mitImage Loggerfür spätere Überprüfung protokollieren.
🛠️ Fehlersuche
Keine Erkennungen:
Confidencereduzieren oder ein klareres Objektbild verwenden.Zu viele kleine Boxen oder Duplikate:
Confidenceerhöhen undNMS Thresholdverringern, um überlappende Erkennungen zusammenzuführen.Falsche Positionen nach Skalierung: Stellen Sie sicher, dass alle Resize-Schritte bei der Interpretation von
Referance Rectanglesberücksichtigt werden.Nur erkannter Text (keine Positionen) benötigt: Block an
OCR/OCR (EasyOCR)anschließen und die Zähler-Ausgabe (Number of Detected Text) zur Steuerung der weiteren Logik nutzen.
Zuletzt aktualisiert