> For the complete documentation index, see [llms.txt](https://docs.augelab.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.augelab.com/german/function-blocks/ai-blocks/ocr.md).

# OCR

Dieser Funktionsblock extrahiert gedruckten oder handschriftlichen Text aus einem Bild und liefert sowohl visuelle als auch textuelle Ergebnisse. Er ist einfach zu bedienen: Bild einspeisen, Empfindlichkeit anpassen und bei Bedarf Auto-Rotation oder Textüberlagerung aktivieren.

## 📥 Eingänge

* `Image`\
  Dieser Eingangsanschluss akzeptiert das Bild, aus dem Text gelesen werden soll.

## 📤 Ausgänge

* `Result`\
  Annotiertes Bild mit eingezeichneten Textboxen (sofern ein visueller Viewer verbunden ist).
* `Whole Text`\
  Alle erkannten Texte zusammengefügt als ein einzelner String.
* `Texts`\
  Liste der erkannten Textstrings (mehrere Einträge möglich).
* `Boxes`\
  Erkannte Begrenzungsboxen für jede Textinstanz (Koordinaten).

## 🕹️ Steuerungen

* `Auto Rotation`\
  Umschalter, damit der Block versucht, gedrehte oder auf dem Kopf stehende Texte zu lesen.
* `Show Texts`\
  Umschalter, um erkannte Texte und Konfidenzwerte im annotierten Bild anzuzeigen.
* `Threshold`\
  Schieberegler, der die minimale Konfidenz festlegt, die für eine Erkennung akzeptiert wird (niedriger = mehr Ergebnisse, höher = weniger, dafür zuverlässigere Ergebnisse).

## 🎯 Funktionen

* Echtzeit-Textextraktion aus eingespeisten Bildern.
* Option zur automatischen Drehung, damit gedrehte oder auf dem Kopf stehende Texte erfasst werden.
* Konfidenz-Schwellenwert zur Ausfilterung von Erkennungen mit niedriger Zuverlässigkeit.
* Visuelle Ausgabe mit Begrenzungsrahmen und optionaler Textüberlagerung zur schnellen Überprüfung.
* Strukturiertes Ausgabe-Format (Liste von Texten und Boxen) sowie ein zusammengeführter Text-Output für die Weiterverarbeitung.

## ⚙️ Ablauf

Wenn ein Bild an den Eingangsanschluss geliefert wird, läuft der OCR-Prozess und liefert:

* ein annotiertes Bild auf `Result` (sofern verbunden),
* den vollständigen erkannten Text auf `Whole Text`,
* einzelne erkannte Strings auf `Texts`,
* und die Begrenzungsbox-Koordinaten auf `Boxes`.

Verwenden Sie `Auto Rotation`, um die Erkennung bei gedrehten Bildern zu verbessern. Mit `Threshold` können Sie Erkennungen mit geringer Konfidenz ausschließen.

## 📝 Nutzungshinweise

1. Verbinden Sie eine Bildquelle mit `Image` (z. B. Kamera oder Image Loader).
2. Aktivieren Sie `Auto Rotation`, falls Ihre Bilder gedreht sein könnten.
3. Stellen Sie den `Threshold`-Schieberegler ein, um Recall und Präzision zu balancieren.
4. Aktivieren Sie `Show Texts`, wenn das annotierte Bild die erkannten Texte anzeigen soll.
5. Lesen Sie die Ausgänge `Whole Text`, `Texts` und `Boxes` für Protokollierung oder nachgelagerte Verarbeitung aus.

## 💡 Tipps und Tricks

* Für bessere OCR-Ergebnisse das Bild vorverarbeiten mit `Contrast Optimization` und `Blur`, um Rauschen zu reduzieren und den Zeichenkontrast zu verbessern.
* Wenn Sie nur einen bestimmten Bereich betrachten möchten, zuerst mit `Image ROI Select` zuschneiden und das zugeschnittene Bild in diesen Block einspeisen.
* Bei sehr großen Bildern `Image Resizer` verwenden, um die Größe vor der OCR zu reduzieren und die Verarbeitung zu beschleunigen.
* `Show Image` nutzen, um die annotierte Ausgabe während der Entwicklung schnell zu prüfen.
* Falls Sie eine alternative OCR-Engine bevorzugen, probieren Sie `OCR (EasyOCR)` und vergleichen Sie die Ergebnisse.
* Erkannte Frames und Protokolle mit `Image Logger` speichern für Offline-Überprüfung oder Audit-Trails.

Hinweis: Kombinieren Sie z. B. `Image ROI Select`, `Image Resizer`, `Contrast Optimization`, `Blur`, `Show Image`, `Image Logger` und `OCR (EasyOCR)` in Ihrem Flow, um Erkennungsqualität und Performance zu verbessern.

## 🛠️ Fehlersuche

* Kein Text erkannt: Prüfen Sie, ob das Eingangsbild lesbaren Text enthält; erhöhen Sie den Kontrast oder verringern Sie den `Threshold`.
* Rauschartige Ergebnisse (viele False Positives): Erhöhen Sie den `Threshold`, um Erkennungen mit niedriger Konfidenz zu filtern.
* Gedrehte oder auf dem Kopf stehende Texte: `Auto Rotation` aktivieren, bevor Sie den `Threshold` erhöhen.
* Annotiertes Bild erscheint nicht: Stellen Sie sicher, dass ein Viewer verbunden ist oder verwenden Sie `Show Image`, um die visuelle Ausgabe zu routen.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.augelab.com/german/function-blocks/ai-blocks/ocr.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.