EfficientDet: Drejt Zbulimit Të Shkallëzuar Dhe Efikas Të Objektit

2025 Autor: Ian Gardner | [email protected]. E modifikuara e fundit: 2025-01-24 11:06

Si një nga aplikacionet kryesore në vizionin kompjuterik, zbulimi i objekteve po bëhet gjithnjë e më i rëndësishëm në skenarët që kërkojnë saktësi të lartë, por që kanë burime të kufizuara kompjuterike, të tilla si robotikë dhe makina pa shofer. Fatkeqësisht, shumë detektorë modernë me precizion të lartë nuk i plotësojnë këto kufizime. Më e rëndësishmja, aplikacionet në botën reale të zbulimit të objekteve ekzekutohen në platforma të ndryshme, të cilat shpesh kërkojnë burime të ndryshme.

Pra, pyetja natyrale është se si të projektohen detektorë të saktë dhe efikasë të objekteve që mund të përshtaten gjithashtu me një gamë të gjerë të kufizimeve të burimeve?

EfficientDet: Zbulimi i Shkallëzuar dhe Efikas i Objektit, i miratuar në CVPR 2020, prezanton një familje të re të detektorëve të shkallëzuar dhe efikas të objekteve. Duke u bazuar në punën e mëparshme për shkallëzimin e rrjeteve nervore (EfficentNet) dhe përfshirjen e një rrjeti të ri funksional bi-drejtues (BiFPN) dhe rregullave të reja të shkallëzimit, EfficDet arrin saktësi moderne ndërsa 9 herë më e vogël dhe përdor dukshëm më pak llogaritje sesa detektorët e njohur modernë. Figura e mëposhtme tregon arkitekturën e përgjithshme të rrjetit të modeleve.

Optimizimi i Arkitekturës së Modelit

Ideja prapa EfficDet buron nga një përpjekje për të gjetur zgjidhje për të përmirësuar efikasitetin llogaritës duke ekzaminuar sistematikisht modelet e mëparshme të zbulimit të nivelit më të lartë. Në përgjithësi, detektorët e objekteve kanë tre përbërës kryesorë: një shtyllë kurrizore që nxjerr tipare nga një imazh i caktuar; një rrjet objektesh që merr nivele të shumëfishta funksionesh nga shtylla kurrizore si hyrje dhe nxjerr një listë të funksioneve të kombinuara që përfaqësojnë karakteristikat karakteristike të imazhit; dhe një rrjet përfundimtar i klasës / kutisë që përdor funksione të kombinuara për të parashikuar klasën dhe vendndodhjen e secilit objekt.

Pas shqyrtimit të opsioneve të dizajnit për këto përbërës, ne identifikuam disa optimizime kryesore për të përmirësuar performancën dhe efikasitetin. Detektorët e mëparshëm kryesisht përdorin ResNets, ResNeXt ose AmoebaNet si shtylla kurrizore, të cilat janë ose më pak të fuqishme ose kanë efikasitet më të ulët se EfficNets. Me implementimin fillestar të shtyllës kurrizore EfficNet, mund të arrihet shumë më shumë efikasitet. Për shembull, duke filluar me një bazë bazë RetinaNet që përdor një shtyllë kurrizore ResNet-50, studimi ynë i ablacionit tregon se thjesht zëvendësimi i ResNet-50 me EfficentNet-B3 mund të përmirësojë saktësinë me 3% ndërsa zvogëlon llogaritjen me 20%. Një tjetër optimizim është përmirësimi i efikasitetit të rrjeteve funksionale. Ndërsa shumica e detektorëve të mëparshëm thjesht përdorin Rrjetin e Piramidës Downlink (FPN), ne zbulojmë se FPN në rrjedhën e poshtme është e kufizuar në vetvete në një rrjedhë të njëanshme të informacionit. FPN alternative si PANet shtojnë shtesë në rrjedhën e sipërme me koston e llogaritjes shtesë.

Përpjekjet e fundit për të përdorur Kërkimin e Arkitekturës Neural (NAS) kanë zbuluar një arkitekturë më komplekse NAS-FPN. Sidoqoftë, ndërsa kjo strukturë e rrjetit është efektive, ajo është gjithashtu e parregullt dhe shumë e optimizuar për një detyrë specifike, duke e bërë të vështirë përshtatjen me detyrat e tjera. Për të zgjidhur këto probleme, ne propozojmë një rrjet të ri të funksioneve bi-drejtuese BiFPN, i cili zbaton idenë e kombinimit të funksioneve me shumë shtresa nga FPN / PANet / NAS-FPN, i cili lejon transmetimin e informacionit si nga lart poshtë ashtu edhe nga nga poshtë lart duke përdorur lidhje të rregullta dhe efektive.

Për të përmirësuar më tej efikasitetin, ne propozojmë një teknikë të re të sintetizimit të shpejtë të normalizuar. Qasjet tradicionale zakonisht trajtojnë të gjitha inputet për FPN në të njëjtën mënyrë, madje edhe në rezolucione të ndryshme. Sidoqoftë, ne vërejmë se tiparet e hyrjes me rezolucione të ndryshme shpesh kontribuojnë në mënyrë të pabarabartë në funksionet e daljes. Kështu, ne i shtojmë peshë shtesë secilit funksion hyrës dhe e lëmë rrjetin të mësojë rëndësinë e secilit. Ne gjithashtu do të zëvendësojmë të gjitha konvolucionet e rregullta me konvolucione më pak të kushtueshme, të ndara thellësisht. Me këtë optimizim, BiFPN tonë përmirëson më tej saktësinë me 4% ndërsa ul kostot llogaritëse me 50%.

Optimizimi i tretë përfshin arritjen e kompromisit më të mirë midis saktësisë dhe efikasitetit nën kufizime të ndryshme të burimeve. Puna jonë e mëparshme ka treguar se bashkë shkallëzimi i thellësisë, gjerësisë dhe rezolucionit të një rrjeti mund të përmirësojë ndjeshëm performancën e njohjes së imazhit. Frymëzuar nga kjo ide, ne propozojmë një metodë të re të shkallëzimit të përbërë për detektorët e objekteve që rrit kolektivisht rezolucionin / thellësinë / gjerësinë. Secili komponent i rrjetit, dmth shtylla kurrizore, objekti dhe rrjeti parashikues i bllokut / klasës, do të ketë një faktor kompleks të shkallëzimit që kontrollon të gjitha dimensionet e shkallëzimit duke përdorur rregulla heuristike. Kjo qasje e bën të lehtë përcaktimin e shkallëzimit të modelit duke llogaritur një faktor shkalle për një kufizim të caktuar të burimeve të synuara.

Duke kombinuar shtyllën kurrizore të re dhe BiFPN, ne së pari dizenjojmë një bazë të vogël EfficDet-D0 dhe më pas aplikojmë shkallëzimin e përbërë për të marrë EfficientDet-D1 në D7. Çdo model serial ka një kosto më të lartë llogaritëse, duke mbuluar një gamë të gjerë kufizimesh të burimeve nga 3 miliardë FLOP në 300 miliardë FLOPS, dhe siguron saktësi më të lartë.

Modeli i performancës

Vlerësimi i EfficientDet në bazën e të dhënave COCO, një bazë të dhënash referimi e përdorur gjerësisht për zbulimin e objektit. EfficientDet-D7 arrin një saktësi mesatare mesatare (mAP) prej 52.2, e cila është 1.5 pikë më e lartë se modeli i mëparshëm modern, duke përdorur 4 herë më pak parametra dhe 9.4 herë më pak llogaritje

Ne gjithashtu krahasuam madhësinë e parametrit dhe latencën e CPU / GPU midis EfficientDet dhe modeleve të mëparshme. Me kufizime të ngjashme të saktësisë, modelet EfficDet funksionojnë 2-4 herë më shpejt në GPU dhe 5-11 herë më shpejt në procesor sesa detektorët e tjerë. Ndërsa modelet EfficDet kanë për qëllim kryesisht zbulimin e objekteve, ne gjithashtu testojmë efektivitetin e tyre në detyra të tjera të tilla si segmentimi semantik. Për të kryer detyrat e segmentimit, ne modifikojmë lehtë EfficDet-D4 duke zëvendësuar humbjen dhe humbjen e kokës së zbulimit dhe kokës duke ruajtur të njëjtën shtyllë kurrizore të shkallëzuar dhe BiFPN. Ne e krahasojmë këtë model me modelet e mëparshme moderne të segmentimit për Pascal VOC 2012, një set i të dhënave të testimit të segmentimit të përdorur gjerësisht.

Duke pasur parasysh performancën e tyre të jashtëzakonshme, EfficDet pritet të shërbejë si një themel i ri për hulumtimin e zbulimit të objektit në të ardhmen dhe potencialisht t'i bëjë modelet shumë të sakta të zbulimit të objekteve të dobishëm në shumë aplikime në botën reale. Kështu u hapën të gjitha pikat e ndarjes së kodit dhe modelit të parapërgatitur në Github.com.

Recommended:

Të Gjitha Avantazhet Dhe Disavantazhet E Xiaomi Mi Pad 4 Dhe Nëse Krahasohet Me IPad

Xiaomi Mi Pad 4 është një tablet që ka performancë të lartë dhe kushton relativisht pak para. Por a ia vlen vëmendja e konsumatorëve dhe a ka nevojë për të? Projektimi Pamja e pajisjes është e këndshme, duket mjaft mirë - paneli i pasmë metalik është lakonik dhe nuk lë gjurmë gishtash dhe njollos vetveten, dhe për këtë arsye mbulesa nevojitet vetëm për sigurinë e pajisjes

Lenovo Phab Dhe Lenovo Phab Plus: Përmbledhje Dhe Specifikime

Lenovo Phab Plus është një smartphone, madhësia e të cilit është e krahasueshme me një tabletë të vogël, ka karakteristika teknike shumë të mira dhe një çmim të ulët të përballueshëm. Telefonat inteligjentë Lenovo arrijnë një ekuilibër të mirë midis çmimit dhe cilësisë, duke u siguruar përdoruesve një produkt të përballueshëm me cilësi të lartë

Avantazhet Dhe Disavantazhet E Printerëve Me Bojë Dhe Laser

Printerët janë ngulitur fort në jetën e përditshme njerëzore. Diploma, abstrakte, fletë mashtrimi, deklarata, urdhra, raporte, një larmi e madhe dokumentesh - e gjithë kjo ka qenë prej kohësh e pranueshme vetëm në formë të shtypur. Shtypja amatore e fotografive po bëhet gjithashtu e njohur

Alcatel Idol 5 Dhe 5s: Rishikim Dhe Specifikime, Krahasim Me Idol 4 Dhe 4s

Në vitin 2017, Alcatel përsëri i gëzoi konsumatorët me pajisjet e tij - idhullin 5 dhe versionin e tij më të mirë të idhullit 5s. Por a janë ato aq të mira krahasuar me gjeneratën e saj të mëparshme të serialit? Në mënyrë që t'i përgjigjemi kësaj pyetjeje, le të shohim karakteristikat e telefonave të rinj inteligjentë

Samsung Galaxy S8 Dhe S8 Plus (Samsung S8 Dhe S8 Plus) - Rishikim Dhe Prezantim I Anijeve Të Reja, Specifikimet, Fotot, Data E Lëshimit, çmimi, Blerja, Video

Samsung Galaxy S8 dhe S8 Plus janë gjenerata e tetë e telefonave inteligjentë të serisë Galaxy S të Samsung Electronics që janë të fuqishëm dhe të fuqishëm. Karakteristikat e Samsung Galaxy S8 dhe S8 Plus Samsung Galaxy S8 u lëshua së bashku me S8 Plus në 29 Mars 2017

EfficientDet: Drejt Zbulimit Të Shkallëzuar Dhe Efikas Të Objektit

Përmbajtje:

Optimizimi i Arkitekturës së Modelit

Modeli i performancës

Recommended:

Të Gjitha Avantazhet Dhe Disavantazhet E Xiaomi Mi Pad 4 Dhe Nëse Krahasohet Me IPad

Lenovo Phab Dhe Lenovo Phab Plus: Përmbledhje Dhe Specifikime

Avantazhet Dhe Disavantazhet E Printerëve Me Bojë Dhe Laser

Alcatel Idol 5 Dhe 5s: Rishikim Dhe Specifikime, Krahasim Me Idol 4 Dhe 4s

Samsung Galaxy S8 Dhe S8 Plus (Samsung S8 Dhe S8 Plus) - Rishikim Dhe Prezantim I Anijeve Të Reja, Specifikimet, Fotot, Data E Lëshimit, çmimi, Blerja, Video

Si Të Telefononi MTS

Si Të Telefononi Një Operator MTS Nga Një Telefon Celular

Si Të Telefononi Shërbimin E Mbështetjes Së MTS

Si Të Kontaktoni Direkt Me Operatorin Megafon

Si Të Telefononi Operatorin Megafon Nga Një Telefon Celular

Si Të Ngarkoni Një Hartë GPS Në Telefonin Tuaj

Si Të Instaloni Java Në Nokia

Si Të Shkarkoni Një Aplikacion Java

Si Të Tokëzoni Kitarën Tuaj

3 Mënyra Për Të Ruajtur Një Celular Të Mbytur

Si Të Kontrolloni Llogarinë Tuaj Neto Të Personave

Si Të Merrni Fjalëkalimin Dhe UIN Në Icq Në Telefon

Si Të Kopjoni Fotot

Si Të Përdorni Një Modem Të Telefonit Celular

Si Të Refuzoni Motin E MTS-së