Mai multe Instanțe de Același Obiect în Imaginea - Obiect de Detectare Folosind CNN

Question 1

Noi la NN lui. Un CNN pot fi instruiți pentru a detecta un singur obiect dintr-o imagine. Cu toate acestea, dacă orice imagine într-un set de date ar putea conține orice n # de obiecte. Acest lucru nu reprezintă o problemă pentru CNNs ca ieșire dens strat trebuie sa fie de o dimensiune fixă? Cum ai rezolva aceasta problema?

De exemplu: Să spunem că am luat la întâmplare 2 imagini de la acest set. Imaginea 1 a 2 obiecte și imagine 2 are 5 obiecte. Y eticheta pentru img1 ar conține caseta de încadrare coordonatele pentru 2 obiecte; y eticheta pentru img2 ar conține coordonatele pentru 5 obiecte mult mai mari, y vector decât img1.

O posibilă soluție? :

Mi-ar nevoie pentru a găsi imaginea cu cea mai mare # de obiecte (a desemna această valoare ca M). Să spun, de asemenea, un obiect are 4 coordonate. Dacă M = 5, as avea nevoie de un vector y de 20. Dacă o imagine are 1 obiect, y vector ar conține 4 non-valori zero ȘI 16 valori de zero. 4 non-zero valori ar reprezenta coordonatele și 16 zero valori ar reprezenta coordonatele alte obiecte non-existente.

Question 2

Modul de bază de a face mai multe clasificare object este folosind segmentarea. Acest lucru este realizat prin segmentarea imaginea de intrare la mai multe sub-zone și hrăni fiecare zonă a rețelei neuronale.

Cu toate acestea, aceasta este o metodă de bază și acum există mulți algoritmi avansați care fac segmentare în mod automat.

În general, mai multe obiecte de clasificare este abordată în două etape: în Primul rând o regiune propunere de algoritm să ghicească ce părți ale imaginii conține obiectul.

Cel de-al doilea este un algoritm pentru a clasifica regiunile propuse.

img sursa

Reda El Hail · Answer 1 · 2021-11-21T05:58:06

Modul de bază de a face mai multe clasificare object este folosind segmentarea. Acest lucru este realizat prin segmentarea imaginea de intrare la mai multe sub-zone și hrăni fiecare zonă a rețelei neuronale.

Cu toate acestea, aceasta este o metodă de bază și acum există mulți algoritmi avansați care fac segmentare în mod automat.

În general, mai multe obiecte de clasificare este abordată în două etape: în Primul rând o regiune propunere de algoritm să ghicească ce părți ale imaginii conține obiectul.

Cel de-al doilea este un algoritm pentru a clasifica regiunile propuse.

img sursa

Ceva de genul mai Repede R-CNN realizează segmentarea prin utilizarea RPN pentru a extrage caracteristici considerate relevante? Este înțelegerea mea a acestui corect? În plus, ceea ce ar fi y vector arata având în vedere că acolo sunt variabile de predicție etichete pentru imagini.

Mai multe Instanțe de Același Obiect în Imaginea - Obiect de Detectare Folosind CNN

Problema

Cel mai bun răspuns

În alte limbi

Această pagină este în alte limbi

Popular în această categorie

Întrebări frecvente în această categorie