Noi la NN lui. Un CNN pot fi instruiți pentru a detecta un singur obiect dintr-o imagine. Cu toate acestea, dacă orice imagine într-un set de date ar putea conține orice n # de obiecte. Acest lucru nu reprezintă o problemă pentru CNNs ca ieșire dens strat trebuie sa fie de o dimensiune fixă? Cum ai rezolva aceasta problema?
De exemplu: Să spunem că am luat la întâmplare 2 imagini de la acest set. Imaginea 1 a 2 obiecte și imagine 2 are 5 obiecte. Y eticheta pentru img1 ar conține caseta de încadrare coordonatele pentru 2 obiecte; y eticheta pentru img2 ar conține coordonatele pentru 5 obiecte mult mai mari, y vector decât img1.
O posibilă soluție? :
Mi-ar nevoie pentru a găsi imaginea cu cea mai mare # de obiecte (a desemna această valoare ca M). Să spun, de asemenea, un obiect are 4 coordonate. Dacă M = 5, as avea nevoie de un vector y de 20. Dacă o imagine are 1 obiect, y vector ar conține 4 non-valori zero ȘI 16 valori de zero. 4 non-zero valori ar reprezenta coordonatele și 16 zero valori ar reprezenta coordonatele alte obiecte non-existente.