OCR (EasyOCR)
Dieser Funktionsblock erkennt und extrahiert Text aus Bildern mithilfe einer OCR-Engine. Er ist für eine einfache Integration ausgelegt: Bild bereitstellen, Konfidenz-Schwelle anpassen und optional automatische Rotation zulassen, um die Erkennung gedrehter Texte zu verbessern.
📥 Eingänge
ImageGraustufen- oder Farbbild, das den zu erkennenden Text enthält.
📤 Ausgänge
ResultBild mit markierten Boxen und optionalen Textlabels (wenn Visualisierung downstream aktiv ist).Whole TextVollständig erkannter Text als einzelner String (Wörter zusammengefügt).TextsEinzelne erkannte Textsegmente als Liste.BoxesBegrenzungs-Polygone (4 Punkte) für jeden erkannten Textbereich.
🕹️ Steuerungen
Auto RotationUmschalter, um gedrehte Versionen des Eingabebildes zu prüfen (nützlich bei gedrehten Texten wie auf geneigten Schildern oder Fotos).Show TextsUmschalter, um erkannte Textlabels in der annotierten Bild-Ausgabe anzuzeigen (wenn Visualisierung angeschlossen ist).ThresholdSchieberegler, um die minimale Konfidenz festzulegen, die eine Erkennung akzeptiert. Höhere Werte verringern False Positives, können aber schwach sichtbaren Text übersehen.
✨ Features
Mehrwinkel-Erkennung bei aktiviertem
Auto Rotation, verbessert die Erkennung gedrehter Texte.Konfidenzbasierte Filterung über
Thresholdzur Steuerung der Erkennungsstrenge.Liefert sowohl Textresultate als auch präzise Begrenzungs-Polygone für jede Erkennung — ideal für weitere Verarbeitung oder Protokollierung.
Nutzt bei Verfügbarkeit Hardware-Beschleunigung zur Leistungsverbesserung.
📊 How it runs
Wenn ein Bild an Image angelegt wird, analysiert der Block das Bild auf Text unter Berücksichtigung der eingestellten Threshold- und Rotations-Einstellungen. Akzeptierte Erkennungen werden als Text und Boxes zurückgegeben. Ist die Visualisierung angeschlossen, erscheint zusätzlich ein annotiertes Bild auf dem Result-Ausgang (mit Boxen und optionalen Labels).
📝 Quick start
Verbinde einen bildliefernden Block (z. B. Kamera oder Image Loader) mit
Image.Aktiviere
Auto Rotation, falls der Text gedreht sein könnte.Passe
Thresholdan, um die Balance zwischen Empfindlichkeit und Fehlalarmen zu finden.Verwende
Boxes, um Erkennungen zu zeichnen oder zu protokollieren, oder verbindeResultmit einem Anzeige-Block zur Vorschau.
💡 Tips and Tricks
Vorverarbeitung kleiner oder verrauschter Texte mit
Image ResizeroderSuper Resolutionkann die Lesbarkeit und OCR-Qualität verbessern.Auf ROI zuschneiden mit
Image ROI SelectoderImage ROI, damit OCR nur relevante Bereiche verarbeitet (schneller und genauer).Kontrast verbessern und Rauschen reduzieren mit
Contrast Optimization,DenoisingoderAdjust Colorsvor der OCR.Ablenkende Hintergründe entfernen mit
Background Removal (RMBG-1.4)oderBackground Removal (BiRefNet)bei komplexen Szenen.Für schnelle visuelle Prüfungen
ResultanShow Imageanschließen, um Box-Platzierung und Textlabels zu kontrollieren.Zum Vergleichen der Erkennungsqualität alternativ den anderen
OCR-Block ausprobieren.Erkannten Text und Logs mit
CSV Exportspeichern oder strukturierte Logs mitData to JSONerzeugen.Bei vielen False Positives
Thresholderhöhen oder gezielt Bereiche mitApply Maskausschließen.
🛠️ Troubleshooting
Keine Texte erkannt: Bildgröße mit
Image Resizererhöhen oder Klarheit mitDenoising/Contrast Optimizationverbessern.Niedrige Konfidenzen:
Thresholderhöhen und Hintergrund mit Background-Removal-Blöcken bereinigen.Text gedreht oder auf dem Kopf:
Auto Rotationaktivieren. Falls nur ein Winkel problematisch ist, ROI auswählen und extern drehen.Viele Fehlalarme bei strukturierten Hintergründen: Verarbeite nur relevante Bereiche mit
Image ROI Selectund blocke störende Zonen mitApply Mask.Strukturiertes Ergebnis gewünscht:
TextsundBoxesinData to JSONoderCSV Exportrouten für Speicherung oder weitere Systeme.
Zuletzt aktualisiert