Rangkaian saraf konvolusi (CNN) mula-mula direka bentuk untuk tujuan pengecaman imej dalam bidang penglihatan komputer. Rangkaian ini ialah jenis rangkaian neural buatan khusus yang telah terbukti sangat berkesan dalam menganalisis data visual. Perkembangan CNN didorong oleh keperluan untuk mencipta model yang boleh mengklasifikasikan dan mengkategorikan imej dengan tepat, dan kejayaan mereka dalam domain ini telah membawa kepada penggunaannya yang meluas dalam pelbagai aplikasi lain seperti pengesanan objek, pembahagian imej, dan juga pemprosesan bahasa semula jadi.
CNN diilhamkan oleh struktur dan fungsi korteks visual dalam otak manusia. Seperti korteks visual, CNN terdiri daripada berbilang lapisan neuron yang saling berkaitan yang memproses pelbagai aspek data input. Inovasi utama CNN terletak pada keupayaan mereka untuk mempelajari secara automatik dan mengekstrak ciri yang berkaitan daripada imej, menghapuskan keperluan untuk kejuruteraan ciri manual. Ini dicapai melalui penggunaan lapisan konvolusi, yang menggunakan penapis pada imej input untuk mengesan pelbagai corak dan ciri visual, seperti tepi, bucu dan tekstur.
Kejayaan pertama dalam CNN datang dengan pengenalan seni bina LeNet-5 oleh Yann LeCun et al. pada tahun 1998. LeNet-5 direka khusus untuk pengecaman digit tulisan tangan dan mencapai prestasi yang luar biasa pada set data MNIST, set data penanda aras yang digunakan secara meluas untuk menilai algoritma pengecaman imej. LeNet-5 menunjukkan kuasa CNN dalam menangkap ciri hierarki daripada imej, membolehkan pengelasan yang tepat walaupun dengan adanya variasi dalam skala, putaran dan terjemahan.
Sejak itu, CNN telah berkembang dengan ketara, dengan seni bina yang lebih mendalam dan lebih kompleks dibangunkan. Satu kemajuan yang ketara ialah pengenalan seni bina AlexNet oleh Alex Krizhevsky et al. pada tahun 2012. AlexNet mencapai kejayaan dalam klasifikasi imej dengan memenangi Cabaran Pengecaman Visual Skala Besar ImageNet (ILSVRC) dengan kadar ralat yang jauh lebih rendah berbanding pendekatan sebelumnya. Kejayaan ini membuka jalan kepada penggunaan meluas CNN dalam tugas pengecaman imej.
CNN juga telah berjaya digunakan untuk tugas penglihatan komputer yang lain. Sebagai contoh, dalam pengesanan objek, CNN boleh digabungkan dengan lapisan tambahan untuk menyetempatkan dan mengklasifikasikan objek dalam imej. Rangkaian Neural Convolutional (R-CNN) berasaskan Wilayah yang terkenal yang diperkenalkan oleh Ross Girshick et al. pada tahun 2014 adalah contoh seni bina sedemikian. R-CNN mencapai hasil terkini pada penanda aras pengesanan objek dengan memanfaatkan kuasa CNN untuk pengekstrakan ciri dan menggabungkannya dengan kaedah cadangan wilayah.
Rangkaian saraf konvolusi pertama kali direka untuk tugas pengecaman imej dalam bidang penglihatan komputer. Mereka telah merevolusikan bidang dengan mempelajari ciri yang berkaitan secara automatik daripada imej, menghapuskan keperluan untuk kejuruteraan ciri manual. Perkembangan CNN telah membawa kepada kemajuan yang ketara dalam klasifikasi imej, pengesanan objek, dan pelbagai tugas penglihatan komputer yang lain.
Soalan dan jawapan terbaru lain mengenai Pembelajaran Dalam Lanjutan EITC/AI/ADL:
- Mengapakah kita perlu menggunakan pengoptimuman dalam pembelajaran mesin?
- Bilakah overfitting berlaku?
- Bolehkah Rangkaian Neural Convolutional mengendalikan data berjujukan dengan menggabungkan belitan dari semasa ke semasa, seperti yang digunakan dalam model Jujukan Konvolusi kepada Jujukan?
- Adakah Generative Adversarial Networks (GAN) bergantung pada idea penjana dan diskriminator?