> For the complete documentation index, see [llms.txt](https://docs.augelab.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.augelab.com/german/function-blocks/ai-blocks/text-detection.md).

# Text Detection

Dieser Funktionsblock findet Textbereiche in einem Bild und visualisiert sie. Er ist auf die Erkennung orientierter Textfelder (gedreht oder geneigt) abgestimmt und liefert sowohl ein Vorschaubild als auch strukturierte Positionsdaten zur weiteren Verarbeitung.

## 📥 Eingänge

`Image Any` — Eingabebild, das auf Text analysiert werden soll.

## 📤 Ausgänge

`Image Any` — Annotiertes Bild mit eingezeichneten erkannten Textbereichen.

`Referance Point` — Liste der Referenzpunkte (Eckpunkte) für jeden erkannten Textbereich.

`Referance Rectangles` — Liste der Begrenzungsrechtecke für jeden erkannten Textbereich.

`Number of Detected Text` — Gesamte Anzahl der gefundenen Textbereiche.

## 🕹️ Steuerungen

`Confidence` — Legt die minimale Konfidenz fest, die eine Erkennung haben muss, um akzeptiert zu werden. Höhere Werte reduzieren Fehlalarme, können aber schwach sichtbaren Text übersehen.

`NMS Threshold` — Steuert, wie stark sich überlappende Erkennungen zusammengeführt werden. Niedrigere Werte führen zu strengerem Zusammenführen und reduzieren doppelte Boxen über demselben Text.

## ⚙️ Ausführungsmechanismus

Beim Ausführen durchsucht der Block das übergebene Bild nach Regionen, die wie Text aussehen, filtert die Ergebnisse nach `Confidence`, führt überlappende Erkennungen zusammen (NMS) und skaliert gefundene Regionen zurück auf die Größe des Eingabebildes. Als Ergebnis werden ein annotiertes Vorschaubild, Listen mit Referenzpunkten und Rechtecken für jede Erkennung sowie die Gesamtanzahl der erkannten Textbereiche ausgegeben.

## 🎯 Funktionen

* Erkennt gedrehte und geneigte Textregionen, nicht nur horizontale Zeilen.
* Liefert sowohl visuelles Feedback (annotiertes Bild) als auch strukturierte Ausgaben (Punkte, Rechtecke, Anzahl) zur Weiterverarbeitung.
* Einstellbare Empfindlichkeit über `Confidence` und `NMS Threshold`, um Präzision vs. Trefferquote zu balancieren.

## 📝 Nutzungshinweise

1. Stellen Sie ein Bild an den Eingang `Image Any` (Kamera, Dateilader oder Stream).
2. Passen Sie den `Confidence`-Regler an, um Fehlalarme gegen verpasste Texte abzuwägen.
3. Bei mehreren überlappenden Boxen den `NMS Threshold` anpassen, um Duplikate zu reduzieren.
4. Nutzen Sie das annotierte `Image Any`-Output zur Vorschau und `Referance Point` / `Referance Rectangles`, um Bereiche zuzuschneiden, zu extrahieren oder an Erkennungsblöcke weiterzugeben.

## 💡 Tipps und Tricks

* Bei sehr großen Bildern zuerst `Image Resizer` verwenden, um die Verarbeitung zu beschleunigen, und ggf. die Rechteckkoordinaten wieder auf das Originalbild zurückrechnen.
* Für anschließende Texterkennung die gefundenen Ausschnitte an `OCR` oder `OCR (EasyOCR)` anschließen.
* Um sich auf einen bestimmten Bereich zu konzentrieren, zunächst mit `Image ROI` oder `Image ROI Select` zuschneiden und das zugeschnittene Bild in diesen Block einspeisen.
* `Show Image` zur Vorschau verwenden und mit `Draw Result On Image` benutzerdefinierte Statustexte über die Erkennung legen.
* Ergebnisse mit `Image Write` speichern oder Beispiele mit `Image Logger` für spätere Überprüfung protokollieren.

## 🛠️ Fehlersuche

* Keine Erkennungen: `Confidence` reduzieren oder ein klareres Objektbild verwenden.
* Zu viele kleine Boxen oder Duplikate: `Confidence` erhöhen und `NMS Threshold` verringern, um überlappende Erkennungen zusammenzuführen.
* Falsche Positionen nach Skalierung: Stellen Sie sicher, dass alle Resize-Schritte bei der Interpretation von `Referance Rectangles` berücksichtigt werden.
* Nur erkannter Text (keine Positionen) benötigt: Block an `OCR` / `OCR (EasyOCR)` anschließen und die Zähler-Ausgabe (`Number of Detected Text`) zur Steuerung der weiteren Logik nutzen.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.augelab.com/german/function-blocks/ai-blocks/text-detection.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.