# Dataset Collection

Yüksek performanslı bir AI modeli oluşturmanın en hızlı yolu, verileri amaçlı olarak **yakalamaktır**. Bu sayfa, AugeLab Studio’nun yerel araçlarını kullanarak yüksek kaliteli görüntü ve videoların nasıl toplanacağını açıklar.

{% hint style="info" %}
Eğer zaten açıklama (annotation) için hazır bir görüntü/video klasörünüz varsa bu bölümü atlayabilirsiniz.
{% endhint %}

***

## Veri Kümenizi Planlama

Veri toplama öncesinde veri kümenizi planlamak çok önemlidir. İyi yapılandırılmış bir veri kümesi, daha iyi model performansına yol açar.

### 📊 Ne Kadar Veri Gerekir?

Gerekli görüntü sayısı, ortamın ne kadar değiştiğine bağlıdır. Aşağıdaki tablo, toplama hedefiniz için bir başlangıç noktası sağlar.

| Proje Türü             | Ortam                                                    | Sınıf başına önerilen görüntü sayısı\* |
| ---------------------- | -------------------------------------------------------- | -------------------------------------- |
| **Basit**              | Kontrol edilen aydınlatma, sabit kamera, 1-2 sınıf.      | **50 - 150**                           |
| **Endüstriyel**        | Fabrika zemini, vardiya değişimleri, konveyör bandı.     | **200 - 500**                          |
| **Karmaşık**           | Değişken aydınlatma, çok sayıda sınıf, hareketli kamera. | **1.000+**                             |
| **Karmaşık Açık Alan** | Hava koşullarının değiştiği dış mekan sahneleri.         | **2.000+**                             |
| **Nadir Olay**         | Ara sıra oluşan hatalar veya sızıntıların tespiti.       | **50 Hedef / 100 Boş**                 |

> \*Sınıf başına görüntü sayısı, sadece toplam görüntü sayısı değil, her bir nesne kategorisinin açıklanmış (annotated) örnek sayısını ifade eder.

{% hint style="info" %}
En iyi sonuçlar için açı, mesafe ve aydınlatma açısından **çeşitliliğe** odaklanın.
{% endhint %}

{% hint style="warning" %}
Sınıf sayısının veri kümesi boyunca tutarlı olması önemlidir. Eğer değilse, daha sonra sınıfları dengelemek için **augmentation** kullanılabilir.
{% endhint %}

***

### 🏗️ Sınırları Belirleyin

İlk fotoğrafı çekmeden önce bunları yazın; böylece veri kümeniz hem **Temsil Edici** hem de **Tutarlı** olur.

1. **Sınıf Listesi**: Hangi spesifik nesneleri tespit ediyorsunuz?
2. **Kamera Özellikleri**: Nihai montaj açısı, mesafe ve Görüş Alanı (FoV) nedir? Tek mi yoksa birden fazla kamera mı?
3. **Varyasyonlar**: Aydınlatmada (parlama/gölge) veya arka plan karmaşasında değişimler olacak mı?
4. **Negatifler**: "Boş" sahne nasıl görünüyor?
5. **Kapsam**: Modelin kasıtlı olarak görmezden gelmesi gereken nesneler neler?

***

## Kamera Yapılandırması

USB kamera, IP kamera veya endüstriyel kamera kullanıyor olun, toplama öncesinde aşağıdaki ayarların optimize edildiğinden emin olun:

* **Çözünürlük**: 480p ila 720p arası hedefleyin (640x480 yaygın bir standarttır). Daha yüksek çözünürlükler daha sonra küçültülebilir.
* **Kare Hızı**: Çoğu nesne tespiti görevi için 15-30 FPS yeterlidir.
* **Odak**: Toplama sırasında kaymaları önlemek için manuel odak kullanın.
* **Pozlama**: Tutarlı aydınlatma için manuel pozlama ayarlarını kullanın.
* **Ayarları Kaydet**: Kamera ayar profilinizi kaydedin; çoğu kamera ön ayar kaydetmeye izin verir, böylece oturumlar arasında tutarlılık sağlanır.

## Veri Kümesi Toplama

Nesne tespiti veri kümenizi doğrudan AugeLab Studio içinde yerleşik araçlarla görüntü ve video toplayarak oluşturabilirsiniz. Bu, uyumluluk sağlar ve açıklama sürecini kolaylaştırır.

> Alternatif olarak, halka açık veri kümelerini indirebilir veya harici kameralar/yazılımlar kullanabilirsiniz; ancak bu ek biçimlendirme adımları gerektirebilir.

### AugeLab Studio İçinden Yakalama

Studio ortamını kullanmak, toplamanızı otomatikleştirmek için tetikleyiciler (düğmeler, PLC sinyalleri veya zamanlayıcılar) kullanmanıza olanak verir.

### 1. Örnek Projeden Başlayın

AugeLab bu görev için ön yapılandırılmış bir şablonla gelir.

* **Path**: `File` → `Example Projects` (veya "Example Scenarios")
* **Project**: **"Data Collection for AI Training"**

### 📸 Tek Görüntüler: `Image Write` Bloğu

Yüksek kaliteli statik kareler için bunu kullanın. "Aynı sahne, farklı pozisyonlar" durumları için idealdir.

| Girdi/Ayar         | Açıklama                                                                                         |
| ------------------ | ------------------------------------------------------------------------------------------------ |
| **Folder Path**    | Görüntülerin saklanacağı klasör.                                                                 |
| **Save (Trigger)** | Bir kare yakalamak için `True` olarak ayarlayın. Bunu bir düğme veya zamanlayıcı ile eşleştirin. |
| **Compress Image** | **Checked** = `.jpg` (Daha küçük dosya)                                                          |

### 🎥 Sürekli Hareket: `Record Video` Bloğu

Konveyör bantları veya daha sonra kare çıkarmayı planladığınız hızlı hareketli denetimler için en iyisidir.

| Girdi/Ayar                 | Açıklama                               |
| -------------------------- | -------------------------------------- |
| **Video Quality**          | **Compressed** = `.mp4`                |
| **Trigger Mode: Spacebar** | Başlat/Durdur için Space tuşuna basın. |
| **Trigger Mode: Once**     | `Record=True` kaydı açıp kapatır.      |

> Kayıtları tek bir devasa dosya yerine kısa, odaklanmış klipler (10–60s) olarak planlayın. Bu, kare çıkarmayı çok daha kolay hale getirir.

***

## 📉 Arka Plan (Negatif) Görüntüleri Toplama

Güçlü bir model neyi tespit etmeyeceğini de bilmelidir. Bu nedenle "Boş" sahneleri kasıtlı olarak yakalamalısınız.

* **Ne yakalanmalı**: Boş konveyörler, boş iş istasyonları veya sık görülen hedef dışı nesneler (aparatlar, aletler).
* **Empty**: Bir açıklama dosyası vardır, ancak içinde kutu (box) yoktur.
* **Excluded**: Hiç açıklama dosyası yoktur.

***

## Genel Veri Kümeleri

Kendi verilerinizi desteklemeniz gerekirse, şu halka açık veri kümelerini değerlendirin:

* [COCO Dataset](https://cocodataset.org/#home): Büyük ölçekli nesne tespiti, segmentasyon ve açıklama veri kümesi.
* [Pascal VOC](http://host.robots.ox.ac.uk/pascal/VOC/): Nesne tespiti ve segmentasyon için standart bir veri kümesi.
* [Open Images Dataset](https://storage.googleapis.com/openimages/web/index.html): Görüntü düzeyinde etiketler ve sınırlayıcı kutularla yaklaşık 9 milyon görüntü içeren bir küme.
* [ImageNet](http://www.image-net.org/): Görsel nesne tanıma araştırmaları için tasarlanmış büyük bir görsel veritabanı.
* [Kaggle Datasets](https://www.kaggle.com/datasets): Nesne tespiti dahil olmak üzere çeşitli makine öğrenimi veri kümeleri.

## 📂 Klasör Yapısı ve Hazırlık

AugeLab Studio veri kümelerini klasör bazında yükler. Yapınız şu şekilde olmalıdır:

```
my_dataset/
  ├── 000001.jpg
  ├── 000002.jpg
  ├── background_01.png
  └── classes.names  <-- (İsteğe bağlı, annotation sırasında oluşturulacak)
```

***

## 🏁 Yakalama Kontrol Listesi

| Kontrol        | Gereksinim                                                                         |
| -------------- | ---------------------------------------------------------------------------------- |
| **Kalite**     | Kenarların kaybolduğu yoğun hareket bulanıklığından veya aşırı pozlamadan kaçının. |
| **Kapsama**    | Nesneleri çerçevenin merkezinde, köşelerinde ve kenarlarında yakalayın.            |
| **Ölçek**      | Kameradan nesneye gerçek dünyadaki mesafeyi eşleştirin.                            |
| **Karmaşa**    | Kameranın gerçek hayatta göreceği dağınık arka planları dahil edin.                |
| **Çözünürlük** | Çoğu AI modeli için 480p ila 720p (ortalama 640x480) en iyi sonuç verir.           |


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.augelab.com/turkish/one-cikan-ozellikler/annotate-data-for-object-detection/dataset-collection.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.