> For the complete documentation index, see [llms.txt](https://docs.augelab.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.augelab.com/german/function-blocks/ai-blocks/object-detection-custom.md).

# Object Detection - Custom

Dieser Funktionsblock erkennt Objekte in Bildern mithilfe benutzerdefinierter Modelldateien, die Sie bereitstellen. Sie können einen Detektor laden (weights, config und class list), auswählen, welche Klassen erkannt werden sollen, und die Erkennungs-Sensitivität mit einem einfachen Schieberegler steuern. Der Block liefert ein annotiertes Bild sowie strukturierte Erkennungsdaten zur weiteren Verarbeitung.

## 📥 Eingänge

`Image Any` Das zu analysierende Bild für die Objekterkennung.

## 📤 Ausgänge

`Image Any` Annotiertes Bild mit Erkennungsrahmen und Labels.

`Object Count` Anzahl der erkannten Objekte.

`Object Locations` Liste der Mittelpunkte der erkannten Objekte (mehrere Ausgaben möglich).

`Object Sizes (w, h)` Breite und Höhe für jedes erkannte Objekt (mehrere Ausgaben möglich).

`Object Class` Klassenname für jedes erkannte Objekt (mehrere Ausgaben möglich).

`Rectangles` Koordinaten der Begrenzungsrechtecke für jede Erkennung (mehrere Ausgaben möglich).

## 🕹️ Steuerungen

`Open Weight File` Schaltfläche zum Auswählen der Modellgewichtsdatei.

`Open Config File` Schaltfläche zum Auswählen der Modellkonfigurationsdatei.

`Open Class File` Schaltfläche zum Auswählen einer Textdatei mit Klassennamen.

`Class Names` Tabelle, in der verfügbare Klassen aufgelistet sind und die Sie ein- oder ausschalten können.

`Confidence Threshold %` Schieberegler zur Einstellung der Erkennungs-Confidence (höher = strenger).

## ⚙️ Ausführungsmechanismus

* Der Block benötigt drei Ressourcen, um zu laufen: eine Weight-Datei, eine Config-Datei und eine Class-List-Datei. Laden Sie diese über die drei Datei-Schaltflächen.
* Nachdem die Dateien geladen sind, wird der Detektor initialisiert und bleibt einsatzbereit, bis Sie die Dateien ändern.
* Wenn ein Bild am Eingang ankommt, führt der Block die Erkennung aus und liefert:
  * ein annotiertes Bild mit Boxen/Labels,
  * Anzahl und Positionen,
  * Größen, Klassen und Rechteckskoordinaten für jede Erkennung.
* Wenn Sie Weight- oder Config-Dateien ändern, wird der Detektor neu geladen, sodass die neuen Modelle bei folgenden Ausführungen verwendet werden.

## ✨ Funktionen

* Unterstützung für eigene Modelle laden (weights, config und class list).
* Auswahl der zu erkennenden Klassen über eine einfache Checkliste.
* Einstellbarer Confidence-Threshold mit sofortiger Wirkung.
* Liefert sowohl visuelle Ergebnisse als auch strukturierte Daten (Anzahlen, Positionen, Größen, Rechtecke).
* Arbeitet mit mehreren erkannten Objekten und gibt Ergebnisse als Listen für nachgelagerte Blöcke zurück.

## 📝 Nutzungshinweise

1. Klicken Sie auf `Open Weight File` und wählen Sie die Modellgewichtsdatei aus.
2. Klicken Sie auf `Open Config File` und wählen Sie die Modellkonfigurationsdatei aus.
3. Klicken Sie auf `Open Class File` und wählen Sie die Klassennamen-Datei aus. Die Klassenliste wird automatisch gefüllt.
4. Aktivieren Sie nur die Klassen, die Sie in der Tabelle `Class Names` erkennen möchten.
5. Passen Sie `Confidence Threshold %` an, um Sensitivität vs. Fehlalarme auszubalancieren.
6. Geben Sie das Bild an den Eingang `Image Any` und führen Sie das Szenario aus, um das annotierte Bild und die Erkennungsdaten zu erhalten.

## 💡 Tipps und Tricks

* Um Ergebnisse interaktiv zu sehen, verbinden Sie den Ausgang `Image Any` mit dem Block `Show Image`.
* Wenn Eingabebilder sehr groß sind und die Erkennung langsam ist, fügen Sie vor diesem Block den `Image Resizer` ein, um die Auflösung zu reduzieren und die Verarbeitung zu beschleunigen.
* Beschränken Sie die Analyse auf einen bestimmten Bereich, indem Sie vorher `Image ROI` oder `Image ROI Select` verwenden, damit der Detektor nur Regionen von Interesse betrachtet.
* Für das Tracking über mehrere Frames verbinden Sie die Erkennungs-Ausgänge dieses Blocks mit `Object_Detection_Tracker`.
* Benötigen Sie benutzerdefinierte Zeichnungen oder Overlays über die eingebauten Annotationen hinaus, verwenden Sie `Draw Detections` mit den erkannten Rechtecken und Zählern dieses Blocks.
* Speichern Sie interessante Frames mit Erkennungen mittels `Image Logger` oder `Image Write` / `Record Video` zur späteren Überprüfung.
* Überwachen Sie Leistung und GPU-Auslastung bei schwereren Modellen mit `GPU Statistics`.

Hinweis: Aktivieren Sie nur die benötigten Klassen und erhöhen Sie ggf. den Confidence-Threshold, um Fehlalarme zu reduzieren und die Nachverarbeitung zu beschleunigen.

## 🛠️ Fehlersuche

* Fehlende Modelldateien: Stellen Sie sicher, dass alle drei Dateien (weight, config, class list) ausgewählt sind. Der Block kann ohne diese Dateien nicht laufen.
* Keine Erkennungen: Versuchen Sie, den `Confidence Threshold %` zu senken oder weitere Klassen in der Class-Tabelle zu aktivieren. Prüfen Sie außerdem, ob die Klassennamen-Datei zum verwendeten Modell passt.
* Zu viele Fehlalarme: Erhöhen Sie den `Confidence Threshold %` und aktivieren Sie nur die relevanten Klassen, um Rauschen zu reduzieren.
* Langsame Performance: Reduzieren Sie die Eingabebildgröße mit `Image Resizer` oder verwenden Sie kleinere Modelle; ziehen Sie in Betracht, auf eine GPU auszulagern und die Nutzung mit `GPU Statistics` zu überwachen.
* Falsche Klassennamen oder nicht übereinstimmende Dateien: Überprüfen Sie, ob die Class-Datei mit dem geladenen Modell übereinstimmt (Reihenfolge und Namen der Klassen müssen dem Training entsprechen).

## 🔗 Empfohlene Block-Kombinationen

* `Show Image` — Vorschau der Annotationen.
* `Image Resizer` — Beschleunigt Erkennung bei großen Bildern.
* `Image ROI` / `Image ROI Select` — Fokus auf spezifische Bereiche.
* `Object_Detection_Tracker` — Objekte über die Zeit verfolgen.
* `Draw Detections` — Benutzerdefinierte Visualisierung mit Erkennungs-Rechtecken und Zählwerten.
* `Image Logger` / `Image Write` / `Record Video` — Annotierte Ergebnisse zur späteren Prüfung speichern.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.augelab.com/german/function-blocks/ai-blocks/object-detection-custom.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.