📥Recopilación de dataset
La forma más rápida de construir un modelo de IA de alto rendimiento es capturar datos con un propósito. Esta página explica cómo recolectar imágenes y vídeos de alta calidad usando las herramientas nativas de AugeLab Studio.
Puedes omitir esta sección si ya tienes una carpeta de imágenes/vídeos lista para anotar.
Planificación de tu conjunto de datos
Es crucial planificar el conjunto de datos antes de la recolección. Un dataset bien estructurado conduce a un mejor rendimiento del modelo.
📊 ¿Cuánta data necesitas?
La cantidad de imágenes necesarias depende de cuánto cambie el entorno. Usa esta tabla como punto de partida para tu objetivo de recolección.
Simple
Iluminación controlada, cámara fija, 1-2 clases.
50 - 150
Industrial
Planta de producción, turnos cambiantes, cinta transportadora.
200 - 500
Complejo
Iluminación variable, muchas clases, cámara en movimiento.
1,000+
Complejo al aire libre
Escenas exteriores con cambios meteorológicos.
2,000+
Evento raro
Detección de defectos o fugas poco frecuentes.
50 Target / 100 Empty
*Imágenes por clase se refiere al número de instancias anotadas de cada categoría de objeto, no solo al total de imágenes.
Para mejores resultados, apunta a diversidad en ángulos, distancias e iluminación dentro de tu dataset.
El número de clases debe ser consistente a lo largo del dataset. Si no lo es, la aumentación puede ayudar a equilibrar las clases más adelante.
🏗️ Define los límites
Escribe esto antes de tomar la primera foto para asegurar que tu dataset sea Representativo y Consistente.
Lista de clases: ¿Qué objetos específicos vas a detectar?
Especificaciones de la cámara: ¿Cuál será el ángulo final de montaje, la distancia y el campo de visión (FoV)? ¿Una o varias cámaras?
Variaciones: ¿Habrá cambios de iluminación (brillos/sombras) o fondos desordenados?
Negativos: ¿Cómo se ve una escena “vacía”?
Alcance: ¿Qué objetos debe ignorar intencionalmente el modelo?
Configuración de la cámara
Ya sea que uses una cámara USB, IP o industrial, asegúrate de optimizar los siguientes ajustes antes de la recolección:
Resolución: Apunta entre 480p y 720p (640x480 es un estándar común). Las resoluciones más altas pueden reducirse después.
Tasa de frames: 15–30 FPS es suficiente para la mayoría de tareas de detección de objetos.
Enfoque: Ajusta a enfoque manual para evitar cambios durante la captura.
Exposición: Usa exposición manual para mantener la iluminación consistente.
Guardar ajustes: Guarda el perfil de configuración de la cámara; la mayoría permite presets para mantener coherencia entre sesiones.
Recolección del conjunto de datos
Puedes capturar imágenes y vídeos para tu dataset de detección de objetos directamente dentro de AugeLab Studio usando las herramientas integradas. Esto garantiza compatibilidad y agiliza el proceso de anotación.
Otra opción es descargar datasets públicos o usar cámaras/software externos, pero esto puede requerir pasos adicionales de formateo.
Captura dentro de AugeLab Studio
El entorno Studio te permite usar triggers (botones, señales PLC o temporizadores) para automatizar la recolección.
1. Comienza desde el proyecto de ejemplo
AugeLab incluye una plantilla preconfigurada para esta tarea.
Path:
File→Example Projects(o "Example Scenarios")Project: "Data Collection for AI Training"
📸 Imágenes individuales: el bloque Image Write
Image WriteUsa esto para cuadros estáticos de alta calidad. Es ideal para “misma escena, muchas posiciones”.
Folder Path
Dónde se guardan las imágenes.
Save (Trigger)
Poner en True para capturar un fotograma. Emparejar con un botón o un temporizador.
Compress Image
Checked = .jpg (más pequeño)
🎥 Movimiento continuo: el bloque Record Video
Record VideoIdeal para cintas transportadoras o inspecciones rápidas donde luego extraerás frames.
Video Quality
Compressed = .mp4
Trigger Mode: Spacebar
Pulsa Space para iniciar/detener.
Trigger Mode: Once
Record=True alterna la grabación on/off.
Planifica grabaciones cortas y enfocadas (10–60 s) en lugar de un archivo enorme. Esto facilita la extracción de frames.
📉 Captura de imágenes de fondo (negativas)
Un modelo robusto necesita saber qué no detectar. Debes capturar deliberadamente escenas “vacías”.
Qué capturar: Cintas vacías, estaciones de trabajo vacías o objetos comunes no objetivo (soportes, herramientas).
Empty: Existe un archivo de anotación, pero no contiene cajas.
Excluded: No existe archivo de anotación.
Conjuntos de datos públicos
Si necesitas complementar tus propios datos, considera estos datasets públicos:
COCO Dataset: Dataset a gran escala para detección de objetos, segmentación y captions.
Pascal VOC: Dataset estándar para detección de objetos y segmentación.
Open Images Dataset: Con ~9 millones de imágenes anotadas con etiquetas a nivel de imagen y bounding boxes.
ImageNet: Gran base visual diseñada para investigación en reconocimiento visual.
Kaggle Datasets: Varios datasets para machine learning, incluidos de detección de objetos.
📂 Estructura de carpetas y preparación
AugeLab Studio carga datasets por carpeta. Asegúrate de que tu estructura luzca así:
🏁 Lista de verificación para la captura
Calidad
Evita desenfoque por movimiento intenso o sobreexposición donde desaparezcan los bordes.
Cobertura
Captura objetos en el centro, esquinas y bordes del marco.
Escala
Coincide la distancia real entre cámara y objeto.
Desorden
Incluye los fondos desordenados que la cámara verá en producción.
Resolución
La mayoría de los modelos funcionan mejor entre 480p y 720p (640x480 promedio).
Última actualización