> For the complete documentation index, see [llms.txt](https://docs.augelab.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.augelab.com/german/function-blocks/ai-blocks/object-detection-d-fine.md).

# Object Detection (D-FINE)

Dieser Funktionsblock führt Echtzeit-Objekterkennung durch und lässt sich in Bezug auf `Model Size`, Klassenfilter, `Threshold` und optionale Visualisierung konfigurieren. Verwenden Sie ihn, um gängige Objekte in Bildern zu erkennen und zu lokalisieren und die Erkennungsdaten an nachgelagerte Blöcke zum Tracking, Protokollieren oder Visualisieren weiterzuleiten.

## 📥 Eingänge

`Image`\
Das Eingangsbild, das analysiert werden soll. Akzeptiert Farb- oder Graustufenbilder.

## 📤 Ausgänge

`Result`\
Annotiertes Bild mit farbcodierten Begrenzungsrahmen. Erscheint, wenn `Draw Boxes` aktiviert ist.

`Boxes`\
Liste der Bounding-Box-Koordinaten für jede Erkennung.

`Labels`\
Liste der erkannten Klassennamen als Textstrings.

`Scores`\
Konfidenzwerte für jede Erkennung.

## 🕹️ Steuerungen

`Model Size`\
Wählen Sie die Modellgröße, um zwischen Geschwindigkeit und Genauigkeit abzuwägen (z. B. Nano / Small / Medium / Large / XLarge). Kleinere Modelle laufen schneller; größere Modelle liefern bessere Lokalisierung.

`Select Classes`\
Wählen Sie, welche Objektklassen erkannt werden sollen. Wenn keine Klassen ausgewählt sind, werden alle verfügbaren Klassen berücksichtigt.

`Draw Boxes`\
Schaltet ein/aus, ob das Ausgabebild gezeichnete Begrenzungsrahmen und Labels zeigen soll.

`Threshold`\
Stellen Sie die Konfidenz-Schwelle ein (0–100%), die zur Filterung der Erkennungen verwendet wird. Höhere Werte liefern weniger, aber zuverlässigere Erkennungen.

## 🎯 Hauptfunktionen

* Mehrere Modellgrößen zur Balance zwischen Latenz und Erkennungsqualität.
* Klassenfilterung, um sich nur auf relevante Objekte zu konzentrieren.
* Konfidenz-Schwellen zur Steuerung der Präzision.
* Eingebaute, leicht lesbare Visualisierung mit farbigen Boxen und Textlabels.
* Nutzt, wenn möglich, verfügbare Hardwarebeschleunigung für schnellere Inferenz.

## 📝 Verwendung

1. Verbinden Sie ein Bild mit dem Eingang `Image`.
2. Wählen Sie eine passende `Model Size` für Ihre Umgebung (schnell vs. genau).
3. Optional: Wählen Sie über `Select Classes` bestimmte Klassen aus, um Fehlalarme zu reduzieren und die Verarbeitung zu beschleunigen.
4. Stellen Sie `Threshold` ein, um die Empfindlichkeit zu steuern. Beginnen Sie bei etwa 30 und passen Sie nach Bedarf an.
5. Schalten Sie `Draw Boxes` ein, um die Erkennungen im `Result`-Ausgang zu sehen.

## 📊 Was der Block tut

Beim Ausführen analysiert der Block das eingehende Bild, gibt erkannte Bounding-Boxen, zugehörige Labels und Konfidenzwerte zurück und erzeugt optional ein visualisiertes Bild mit Boxen und Label-Text.

## 💡 Tipps und Tricks

* Wenn Ihre Eingabebilder sehr groß sind und die Verarbeitung langsam, fügen Sie vor diesem Block den `Image Resize` Block ein, um die Bildgröße zu reduzieren und den Durchsatz zu erhöhen.
* Für kleine, niedrig aufgelöste Bilder probieren Sie vor der Erkennung den `Super Resolution` Block, um die Erkennungsraten zu verbessern.
* Zur Anzeige der Ergebnisse in der UI verbinden Sie diesen Block mit `Show Image` oder aktivieren `Draw Boxes` und betrachten den `Result`-Ausgang.
* Für Mehrbild-Workflows, bei denen Sie Erkennungen über die Zeit verfolgen möchten, führen Sie `Boxes` und `Labels` in den `Object_Detection_Tracker` Block.
* Speichern Sie Erkennungsbilder oder Beispiele mit `Image Logger` oder `Image Write`, um Datensätze zu erstellen oder für Debugging.
* Exportieren Sie Erkennungsmetadaten (Labels, Scores, Positionen) mit `Data to JSON` oder `CSV Export` für Berichte oder nachgelagerte Systeme.
* Wenn Sie nur bestimmte Bereiche interessieren, schneiden Sie mit `Image ROI` oder `Image ROI Select` vor der Erkennung aus, um Fehlalarme zu reduzieren und die Verarbeitung zu beschleunigen.

## 🛠️ Fehlerbehebung

* Keine Erkennungen: Versuchen Sie, den `Threshold` zu senken und/oder weniger restriktive Klassen auszuwählen, um die Trefferwahrscheinlichkeit zu erhöhen. Prüfen Sie außerdem die Bildqualität; `Super Resolution` oder bessere Beleuchtung können helfen.
* Zu viele Fehlalarme: Erhöhen Sie den `Threshold` und beschränken Sie `Select Classes` auf relevante Klassen.
* Langsame Leistung: Wählen Sie eine kleinere `Model Size` oder fügen Sie `Image Resize` hinzu, um die Eingangsauflösung zu reduzieren. Falls eine GPU vorhanden ist, stellen Sie sicher, dass sie in Ihrer Umgebung aktiviert ist.
* Visualisierung fehlt: Prüfen Sie, ob `Draw Boxes` aktiviert ist, damit das annotierte `Result`-Bild entsteht, oder verbinden Sie Ausgänge mit `Show Image`, um eine Vorschau zu erhalten.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.augelab.com/german/function-blocks/ai-blocks/object-detection-d-fine.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.