Object Detection (D-FINE)

Dieser Funktionsblock führt Echtzeit-Objekterkennung durch und lässt sich in Bezug auf Model Size, Klassenfilter, Threshold und optionale Visualisierung konfigurieren. Verwenden Sie ihn, um gängige Objekte in Bildern zu erkennen und zu lokalisieren und die Erkennungsdaten an nachgelagerte Blöcke zum Tracking, Protokollieren oder Visualisieren weiterzuleiten.

📥 Eingänge

Image Das Eingangsbild, das analysiert werden soll. Akzeptiert Farb- oder Graustufenbilder.

📤 Ausgänge

Result Annotiertes Bild mit farbcodierten Begrenzungsrahmen. Erscheint, wenn Draw Boxes aktiviert ist.

Boxes Liste der Bounding-Box-Koordinaten für jede Erkennung.

Labels Liste der erkannten Klassennamen als Textstrings.

Scores Konfidenzwerte für jede Erkennung.

🕹️ Steuerungen

Model Size Wählen Sie die Modellgröße, um zwischen Geschwindigkeit und Genauigkeit abzuwägen (z. B. Nano / Small / Medium / Large / XLarge). Kleinere Modelle laufen schneller; größere Modelle liefern bessere Lokalisierung.

Select Classes Wählen Sie, welche Objektklassen erkannt werden sollen. Wenn keine Klassen ausgewählt sind, werden alle verfügbaren Klassen berücksichtigt.

Draw Boxes Schaltet ein/aus, ob das Ausgabebild gezeichnete Begrenzungsrahmen und Labels zeigen soll.

Threshold Stellen Sie die Konfidenz-Schwelle ein (0–100%), die zur Filterung der Erkennungen verwendet wird. Höhere Werte liefern weniger, aber zuverlässigere Erkennungen.

🎯 Hauptfunktionen

  • Mehrere Modellgrößen zur Balance zwischen Latenz und Erkennungsqualität.

  • Klassenfilterung, um sich nur auf relevante Objekte zu konzentrieren.

  • Konfidenz-Schwellen zur Steuerung der Präzision.

  • Eingebaute, leicht lesbare Visualisierung mit farbigen Boxen und Textlabels.

  • Nutzt, wenn möglich, verfügbare Hardwarebeschleunigung für schnellere Inferenz.

📝 Verwendung

  1. Verbinden Sie ein Bild mit dem Eingang Image.

  2. Wählen Sie eine passende Model Size für Ihre Umgebung (schnell vs. genau).

  3. Optional: Wählen Sie über Select Classes bestimmte Klassen aus, um Fehlalarme zu reduzieren und die Verarbeitung zu beschleunigen.

  4. Stellen Sie Threshold ein, um die Empfindlichkeit zu steuern. Beginnen Sie bei etwa 30 und passen Sie nach Bedarf an.

  5. Schalten Sie Draw Boxes ein, um die Erkennungen im Result-Ausgang zu sehen.

📊 Was der Block tut

Beim Ausführen analysiert der Block das eingehende Bild, gibt erkannte Bounding-Boxen, zugehörige Labels und Konfidenzwerte zurück und erzeugt optional ein visualisiertes Bild mit Boxen und Label-Text.

💡 Tipps und Tricks

  • Wenn Ihre Eingabebilder sehr groß sind und die Verarbeitung langsam, fügen Sie vor diesem Block den Image Resize Block ein, um die Bildgröße zu reduzieren und den Durchsatz zu erhöhen.

  • Für kleine, niedrig aufgelöste Bilder probieren Sie vor der Erkennung den Super Resolution Block, um die Erkennungsraten zu verbessern.

  • Zur Anzeige der Ergebnisse in der UI verbinden Sie diesen Block mit Show Image oder aktivieren Draw Boxes und betrachten den Result-Ausgang.

  • Für Mehrbild-Workflows, bei denen Sie Erkennungen über die Zeit verfolgen möchten, führen Sie Boxes und Labels in den Object_Detection_Tracker Block.

  • Speichern Sie Erkennungsbilder oder Beispiele mit Image Logger oder Image Write, um Datensätze zu erstellen oder für Debugging.

  • Exportieren Sie Erkennungsmetadaten (Labels, Scores, Positionen) mit Data to JSON oder CSV Export für Berichte oder nachgelagerte Systeme.

  • Wenn Sie nur bestimmte Bereiche interessieren, schneiden Sie mit Image ROI oder Image ROI Select vor der Erkennung aus, um Fehlalarme zu reduzieren und die Verarbeitung zu beschleunigen.

🛠️ Fehlerbehebung

  • Keine Erkennungen: Versuchen Sie, den Threshold zu senken und/oder weniger restriktive Klassen auszuwählen, um die Trefferwahrscheinlichkeit zu erhöhen. Prüfen Sie außerdem die Bildqualität; Super Resolution oder bessere Beleuchtung können helfen.

  • Zu viele Fehlalarme: Erhöhen Sie den Threshold und beschränken Sie Select Classes auf relevante Klassen.

  • Langsame Leistung: Wählen Sie eine kleinere Model Size oder fügen Sie Image Resize hinzu, um die Eingangsauflösung zu reduzieren. Falls eine GPU vorhanden ist, stellen Sie sicher, dass sie in Ihrer Umgebung aktiviert ist.

  • Visualisierung fehlt: Prüfen Sie, ob Draw Boxes aktiviert ist, damit das annotierte Result-Bild entsteht, oder verbinden Sie Ausgänge mit Show Image, um eine Vorschau zu erhalten.

Zuletzt aktualisiert