Fundamentos de la ventana de anotación

Annotate Data for Object Detection

First Look

circle-info

Necesitarás un equipo con una Nvidia GPU, tener instalados CUDA, CUDNN y usar la ventana Module Downloader Window (Module Downloader Window) para instalar el paquete de IA.

La Image Annotation Window de AugeLab Studio permite anotar imágenes dibujando bounding boxes alrededor de los objetos de interés y asociándolos a clases específicas.

Getting Started

Para abrir la Image Annotation Window, ve al menú superior y haz clic en "AI Tools" ➡️ "Image Annotation".

Para anotar imágenes necesitas dos cosas:

  1. Un archivo .class

  2. Un dataset

Class File

Para etiquetar tus datos, primero necesitas un archivo classes.names, que es un archivo de texto simple con extensión .names. Un archivo de clases típico se ve así:

Si no tienes dicho archivo, puedes crear uno usando la sección Classes:

Para crear tu propio archivo de clases:

  1. Escribe un nombre de clase

  2. Haz clic en + para añadir tu clase.

  3. Haz clic en Save Classes (tercer botón) y ya podrás elegir una carpeta.

También puedes hacer clic en - para eliminar clases no deseadas.

Load Image Folder

circle-exclamation

Haz clic en Open Folder en la parte superior de la pantalla y elige la carpeta que contiene todas tus imágenes:

Tras hacer clic en Open Folder, aparecerá un diálogo pidiéndote que selecciones una carpeta y un archivo de clases:

Select Image from List: Después de cargar la carpeta de imágenes, se mostrará una lista de imágenes disponibles. Haz clic en una imagen para seleccionarla y anotarla.

Annotating Images

Anotar imágenes es muy sencillo. Haz clic en la esquina superior izquierda del objeto que deseas detectar, arrastra el ratón y suéltalo cuando hayas terminado.

Annotation Window

Los bounding boxes deben ajustarse de forma ceñida al objeto de interés sin incluir demasiado fondo. Esto ayuda al modelo a enfocarse en las características relevantes del objeto.

Using the Dataset Panel

El panel Dataset ofrece varias funcionalidades:

  1. La función Filter que te permite filtrar varias clases de imágenes:

    • All Todas las imágenes, con y sin anotaciones

    • Annotated Imágenes que contienen anotaciones.

    • Empty Imágenes sin anotaciones, pero incluidas en el entrenamiento. Esto significa que objetos no anotados pueden afectar negativamente el entrenamiento.

    • Excluded Imágenes que no tienen archivo de anotación. No afectan al entrenamiento en absoluto.

  2. La funcionalidad Search te permitirá filtrar imágenes por su nombre.

Annotating Videos

También puedes anotar archivos de vídeo usando el modo Video en la parte superior de la ventana:

Al cambiar al modo video se te pedirá una ruta de archivo. Al elegir el video podrás anotarlo de la misma forma que una carpeta de imágenes.

Tools

Hay varias herramientas en Annotation Tool para ayudarte durante la preparación del dataset:

Class Frequency Analysis

Al hacer clic en Class Frequency Analysis se analizará y mostrará cuántas instancias de cada clase existen en tu dataset.

Esto es útil para comprobar si tienes un dataset balanceado o no.

Augment Dataset

AugeLab Studio aplica automáticamente augmentación al dataset. La augmentación es el proceso de crear datos similares de forma artificial.

Este tema se trata con más detalle en la página Augmenting Your Dataset.

🛠️ Troubleshooting AI Vision

Si tus modelos de IA no se comportan como esperas, usa estos ajustes rápidos para mejorar el rendimiento.

chevron-right🚫 "It annotates nothing" (Zero Detections)hashtag

Cuando la IA es demasiado "tímida" y no etiqueta nada, normalmente es un problema de umbral o de la descripción.

  • Lower Confidence: Reduce ligeramente el Confidence Threshold (por ejemplo).

  • Text Sensitivity: Para Grounding DINO, baja el Text Threshold para que sea menos restrictivo con la coincidencia de palabras.

  • Be Specific: En lugar de "part", prueba con "silver metal bolt" o "red plastic cap". Las descripciones deben ser visuales.

  • Check Lists: Verifica que tu lista de clases esté realmente cargada en la configuración del nodo y que no esté vacía.

chevron-right📦 "Too many wrong boxes" (Ghost Detections)hashtag

Si la pantalla está llena de falsos positivos, necesitas aumentar la "severidad" del modelo.

  • Raise Confidence: Incrementa el Confidence Threshold para filtrar conjeturas de baja certidumbre.

  • Text Strictness: Aumenta el Text Threshold para forzar una correspondencia más estricta entre la imagen y tu prompt.

  • Remove Ambiguity: Evita prompts demasiado generales como "object" o "item". Si la IA etiqueta sombras como "parts", describe específicamente colores o texturas únicas de la pieza.

chevron-right❓ "YOLO model doesn't detect my class"hashtag

Los modelos YOLO estándar están pre-entrenados en datasets específicos.

  • COCO Standard: Los modelos YOLO básicos solo reconocen las 80 categorías de COCO. Tus etiquetas deben coincidir exactamente (por ejemplo, person, cell phone, chair, bottle).

  • Custom Needs: Si necesitas detectar algo específico (como "scratched circuit board"), cambia a un modelo de Text-Prompt (como Grounding DINO) o entrena un modelo Custom YOLO.

chevron-right🐌 "Processing is slow or laggy"hashtag

Los modelos de visión requieren muchos recursos computacionales.

  • First-Run Delay: Es normal que la primera ejecución sea lenta mientras los modelos se descargan e inicializan en memoria.

  • Model Size: Grounding DINO Base y OWLv2 Large ofrecen alta precisión pero son "pesados". Prueba variantes "Tiny" o "Small" para mayor velocidad.

  • Hardware: Asegúrate de que AugeLab esté utilizando tu GPU. Ejecutar modelos grandes en CPU provocará latencia significativa.


💡 ¿Aún atascado?

Prueba el AI Assistant en AugeLab Studio. Describe la vista de tu cámara y cómo lucen actualmente las cajas; a menudo puede sugerir el valor decimal exacto para tus umbrales.

¿Quieres que cree una tabla "Threshold Cheat Sheet" que explique exactamente qué hacen Confidence vs. Text thresholds?](./augment-dataset.md).

circle-exclamation
circle-exclamation

Preprocess Image

La herramienta Preprocess Image te permite cambiar el contraste, brillo y gamma de las imágenes que se muestran en la ventana. Esta función es útil cuando trabajas con imágenes muy oscuras o demasiado brillantes.

Change Class Id

La herramienta Change Class Id te permitirá cambiar todas las instancias anotadas de una clase a otra diferente.

Esta herramienta es útil al fusionar dos datasets distintos.

Shortcuts and Help

chevron-rightPara atajos y ayuda, haz clic en el botón `Help` en el menú superior.hashtag
  • D: Mostrar la siguiente imagen o frame.

  • A: Mostrar la imagen o frame anterior.

  • Shift + D: Avanzar 10 imágenes/frames.

  • Shift + A: Retroceder 10 imágenes/frames.

  • W: Disminuir la selección de clase.

  • S: Incrementar la selección de clase.

  • Shift + W: Disminuir la selección de clase en 3.

  • Shift + S: Incrementar la selección de clase en 3.

  • X: Eliminar la última anotación de bounding box.

  • Shift + C: Borrar todas las anotaciones.

  • O: Añadir un archivo de anotación vacío o limpiar anotaciones.

  • P: Eliminar anotaciones y limpiar el archivo.

  • M: Mover o excluir imagen a otra carpeta (solo en Folder Mode).

  • Shift + Delete: Eliminar imagen y anotación del equipo (solo en Folder Mode).

Training With Custom AI Object Detection Model

Para entrenar un modelo de detección de objetos personalizado, consulta Object Detection Train.

Última actualización