📥Recopilación de dataset

La forma más rápida de construir un modelo de IA de alto rendimiento es capturar datos con un propósito. Esta página explica cómo recolectar imágenes y vídeos de alta calidad usando las herramientas nativas de AugeLab Studio.

circle-info

Puedes omitir esta sección si ya tienes una carpeta de imágenes/vídeos lista para anotar.


Planificación de tu conjunto de datos

Es crucial planificar el conjunto de datos antes de la recolección. Un dataset bien estructurado conduce a un mejor rendimiento del modelo.

📊 ¿Cuánta data necesitas?

La cantidad de imágenes necesarias depende de cuánto cambie el entorno. Usa esta tabla como punto de partida para tu objetivo de recolección.

Tipo de Proyecto
Entorno
Imágenes recomendadas por clase*

Simple

Iluminación controlada, cámara fija, 1-2 clases.

50 - 150

Industrial

Planta de producción, turnos cambiantes, cinta transportadora.

200 - 500

Complejo

Iluminación variable, muchas clases, cámara en movimiento.

1,000+

Complejo al aire libre

Escenas exteriores con cambios meteorológicos.

2,000+

Evento raro

Detección de defectos o fugas poco frecuentes.

50 Target / 100 Empty

*Imágenes por clase se refiere al número de instancias anotadas de cada categoría de objeto, no solo al total de imágenes.

circle-info

Para mejores resultados, apunta a diversidad en ángulos, distancias e iluminación dentro de tu dataset.

circle-exclamation

🏗️ Define los límites

Escribe esto antes de tomar la primera foto para asegurar que tu dataset sea Representativo y Consistente.

  1. Lista de clases: ¿Qué objetos específicos vas a detectar?

  2. Especificaciones de la cámara: ¿Cuál será el ángulo final de montaje, la distancia y el campo de visión (FoV)? ¿Una o varias cámaras?

  3. Variaciones: ¿Habrá cambios de iluminación (brillos/sombras) o fondos desordenados?

  4. Negativos: ¿Cómo se ve una escena “vacía”?

  5. Alcance: ¿Qué objetos debe ignorar intencionalmente el modelo?


Configuración de la cámara

Ya sea que uses una cámara USB, IP o industrial, asegúrate de optimizar los siguientes ajustes antes de la recolección:

  • Resolución: Apunta entre 480p y 720p (640x480 es un estándar común). Las resoluciones más altas pueden reducirse después.

  • Tasa de frames: 15–30 FPS es suficiente para la mayoría de tareas de detección de objetos.

  • Enfoque: Ajusta a enfoque manual para evitar cambios durante la captura.

  • Exposición: Usa exposición manual para mantener la iluminación consistente.

  • Guardar ajustes: Guarda el perfil de configuración de la cámara; la mayoría permite presets para mantener coherencia entre sesiones.

Recolección del conjunto de datos

Puedes capturar imágenes y vídeos para tu dataset de detección de objetos directamente dentro de AugeLab Studio usando las herramientas integradas. Esto garantiza compatibilidad y agiliza el proceso de anotación.

Otra opción es descargar datasets públicos o usar cámaras/software externos, pero esto puede requerir pasos adicionales de formateo.

Captura dentro de AugeLab Studio

El entorno Studio te permite usar triggers (botones, señales PLC o temporizadores) para automatizar la recolección.

1. Comienza desde el proyecto de ejemplo

AugeLab incluye una plantilla preconfigurada para esta tarea.

  • Path: FileExample Projects (o "Example Scenarios")

  • Project: "Data Collection for AI Training"

📸 Imágenes individuales: el bloque Image Write

Usa esto para cuadros estáticos de alta calidad. Es ideal para “misma escena, muchas posiciones”.

Entrada/Ajuste
Lógica

Folder Path

Dónde se guardan las imágenes.

Save (Trigger)

Poner en True para capturar un fotograma. Emparejar con un botón o un temporizador.

Compress Image

Checked = .jpg (más pequeño)

🎥 Movimiento continuo: el bloque Record Video

Ideal para cintas transportadoras o inspecciones rápidas donde luego extraerás frames.

Entrada/Ajuste
Lógica

Video Quality

Compressed = .mp4

Trigger Mode: Spacebar

Pulsa Space para iniciar/detener.

Trigger Mode: Once

Record=True alterna la grabación on/off.

Planifica grabaciones cortas y enfocadas (10–60 s) en lugar de un archivo enorme. Esto facilita la extracción de frames.


📉 Captura de imágenes de fondo (negativas)

Un modelo robusto necesita saber qué no detectar. Debes capturar deliberadamente escenas “vacías”.

  • Qué capturar: Cintas vacías, estaciones de trabajo vacías o objetos comunes no objetivo (soportes, herramientas).

  • Empty: Existe un archivo de anotación, pero no contiene cajas.

  • Excluded: No existe archivo de anotación.


Conjuntos de datos públicos

Si necesitas complementar tus propios datos, considera estos datasets públicos:

📂 Estructura de carpetas y preparación

AugeLab Studio carga datasets por carpeta. Asegúrate de que tu estructura luzca así:


🏁 Lista de verificación para la captura

Verificación
Requisito

Calidad

Evita desenfoque por movimiento intenso o sobreexposición donde desaparezcan los bordes.

Cobertura

Captura objetos en el centro, esquinas y bordes del marco.

Escala

Coincide la distancia real entre cámara y objeto.

Desorden

Incluye los fondos desordenados que la cámara verá en producción.

Resolución

La mayoría de los modelos funcionan mejor entre 480p y 720p (640x480 promedio).

Última actualización