Sun’iy intellekt texnologiyalari yordamida obyektlarni tanib olish

Cover Image for Sun’iy intellekt texnologiyalari yordamida obyektlarni tanib olish

Obyektni aniqlash ikki asosiy vazifani o‘z ichiga oladi: tasvir ichidagi bir yoki bir nechta obyektni lokalizatsiya qilish va tasvirdagi har bir obyektni tasniflash (1-jadvalga qarang). Bu aniqlangan obyekt atrofida uning bashorat qilingan sinfi bilan chegaralovchi quti chizish orqali amalga oshiriladi. Bu shuni anglatadiki, tizim tasvirlarni tasniflash vazifalarida bo‘lgani kabi nafaqat tasvir sinfini bashorat qiladi, shuningdek aniqlangan obyektga mos keladigan cheklovchi qutining koordinatalarini bashorat qiladi. Bu ancha murakkab, chunki u tasvirdagi har bir obyekt atrofida chegaralovchi qutini topish va chizish uchun obyektni muvaffaqiyatli lokalizatsiya qilishni va mahalliylashtirilgan obyektning to‘g‘ri sinfini bashorat qilish uchun obyekt tasnifini talab qiladi.

Image classificationObject detection
Maqsad tasvirdagi obyektning turi yoki sinfini bashorat qilishdir.
  • Kirish: bitta obyektga ega tasvir
  • Natija: sinf yorlig’i (mushuk, it va boshqalar)
  • Natija: sinf ehtimoli (masalan, 84% mushuk)
Maqsad, tasvirdagi obyektlarning joylashishini taxmin qilish orqali chegaralovchi qutilar va joylashgan obyektlarning sinflarini bashoratlash.
  • Kirish: bir yoki bir nechta ob’ektga ega tasvir
  • Chiqish: bir yoki bir nechta chegaralovchi qutilar (koordinatalar bilan belgilangan) va har bir chegaralovchi quti uchun sinf yorlig‘i
  • Ikki obyektli tasvir uchun chiqish misoli: – box1 koordinatalari (x, y, w, h) va sinf ehtimoli – box2 koordinatalari va sinf ehtimoli
Eʼtibor bering, tasvir koordinatalari (x, y, w, h) quyidagicha: (x va y) – chegaralangan qutining markaziy nuqtasining koordinatalari va (w va h) – qutining kengligi va balandligi.

Obyektni aniqlash ko‘plab sohalarda keng qo‘llaniladi. Misol uchun, o‘z-o‘zini boshqarish texnologiyasida biz olingan video tasvirda transport vositalari, piyodalar, yo‘llar va to‘siqlarning joylashishini aniqlash orqali marshrutlarni rejalashtirishimiz mumkin. Robotlar ko‘pincha o‘rganish maqsadida ushbu turdagi vazifalarni bajaradilar. Va xavfsizlik sohasidagi tizimlar g‘ayritabiiylikni aniqlashlari kerak, misol uchun, bosqinchilar yoki bombalar kabi nishonlar.

Obyektni aniqlashning umumiy tizimi

Odatda obyektni aniqlash tizimi to‘rtta komponentdan iborat:

  • Mintaqa taklifi – Tizim tomonidan keyinchalik qayta ishlanadigan qiziqish hududlarini (RoIs) yaratish uchun ishlatiladigan algoritm yoki DL modeli. Bular tarmoq ob‘ektni o‘z ichiga olishi mumkin deb hisoblaydigan mintaqalar; chiqish ko‘p sonli cheklovchi qutilar bo‘lib, ularning har biri obyektivlik balliga ega. Katta obyektivlik ballari bo‘lgan qutilar keyinchalik qayta ishlash uchun tarmoq qatlamlari bo‘ylab o‘tkaziladi.
  • Xususiyatlarni ajratish va tarmoq prognozlari – Vizual xususiyatlar har bir cheklov qutisi uchun chiqariladi. Ular baholanadi va takliflarda vizual xususiyatlar (masalan, obyektlarni tasniflash komponenti) asosida qanday obyektlar mavjudligi aniqlanadi.
  • Maksimal bo‘lmagan bostirish (NMS) – Ushbu bosqichda model, ehtimol, bir xil obyekt uchun bir nechta chegaralovchi qutilarni topdi. NMS har bir obyekt uchun bir-birining ustiga chiqadigan qutilarni bitta chegaralovchi qutiga birlashtirib, bir xil misolni takroran aniqlashning oldini olishga yordam beradi.
  • Baholash ko‘rsatkichlari – aniqlikka o‘xshash, obyektni aniqlash tizimlari o‘zlarining aniqlash samaradorligini baholash uchun o‘z ko‘rsatkichlariga ega. Biz o‘rtacha o‘rtacha aniqlik (mAP), aniqlik-eslash egri chizig‘i (PR egri chiziq) va birlashma ustidagi kesishma (IoU) kabi eng mashhur ko‘rsatkichlarni ko‘rib o‘tamiz.

Mintaqa takliflari (Region proposals)

Ushbu bosqichda tizim rasmga qaraydi va keyingi tahlil uchun RoI(qayta ishlanadigan qiziqish hududlari)larni taklif qiladi. RoIlar tizim ob‘ektni o‘z ichiga olish ehtimoli yuqori deb hisoblaydigan mintaqalar bo‘lib, ular obyektivlik reytingi deb ataladi (2-rasm). Obyektivlik ko‘rsatkichlari yuqori bo‘lgan hududlar keyingi bosqichlarga o‘tkaziladi; past ballga ega bo‘lgan hududlar tashlab ketiladi.

Region proposal ishlash prinsipi

Mintaqaviy takliflarni ishlab chiqishda bir necha yondashuvlar mavjud. Dastlab, selektiv qidiruv algoritmi obyekt takliflarini yaratish uchun ishlatilgan; buni R-SNN tarmog‘ida ko‘rish mumkin. Boshqa yondashuvlar hududlarni yaratish uchun chuqur neyron tarmog‘i tomonidan tasvirdan olingan yana-da murakkab vizual xususiyatlardan foydalanadi (masalan, DL modeli xususiyatlariga asoslangan).

Shuni taʼkidlash kerakki, bu qadam tarmoq tomonidan yana-da tahlil qilish va tasniflash uchun juda ko‘p (minglab) chegara qutilarini ishlab chiqaradi. Ushbu bosqichda tarmoq tasvirdagi ushbu hududlarni tahlil qiladi va obyektivlik reytingiga qarab har bir hududni oldingi (obyekt) yoki fon (obyekt yo‘q) deb tasniflaydi. Agar obyektivlik ko‘rsatkichi maʼlum bir chegaradan yuqori bo‘lsa, u holda bu mintaqa oldingi o‘rinda hisoblanadi va tarmoqda oldinga suriladi. Eʼtibor bering, bu chegara sizning muammoingiz asosida sozlanishi mumkin. Agar chegara juda past bo‘lsa, sizning tarmog‘ingiz barcha mumkin bo‘lgan takliflarni to‘liq ishlab chiqaradi va siz tasvirdagi barcha obyektlarni aniqlash imkoniyatiga ega bo‘lasiz. Boshqa tomondan, bu hisoblash uchun juda qimmat va aniqlashni sekinlashtiradi. Shunday qilib, mintaqalar bo‘yicha takliflarni ishlab chiqarish bilan hisoblashish murakkabligi bilan mintaqalar soni va to‘g‘ri yondashuv RoI sonini kamaytirish uchun muammoga oid maʼlumotlardan foydalanishdir.

Xulosa

Ushbu maqolada obyektni tanib olishning umumiy texnologiyasi haqida gapirib o‘tdik. Zamonaviy texnologiya bir joyda to‘xtab turgani yo‘q. Ushbu texnologiya yangi elementlar bilan boyib bormoqda. Keyingi maqolada bu haqida batafsil tanishishingiz mumkin.

Taggedartificial inteligenceobject detectionobyektlarni aniqlashsun’iy intellekttimsollarni aniqlash