×
1 Pilih Sijil EITC/EITCA
2 Belajar dan ambil peperiksaan dalam talian
3 Dapatkan sijil kemahiran IT anda

Sahkan kemahiran dan kecekapan IT anda di bawah rangka kerja Pensijilan IT Eropah dari mana-mana sahaja di dunia dalam talian sepenuhnya.

Akademi EITCA

Piawaian pengesahan kemahiran digital oleh Institut Pensijilan IT Eropah yang bertujuan untuk menyokong pembangunan Masyarakat Digital

LOG MASUK KE AKAUN ANDA

Buat akaun Lupa kata laluan?

Lupa kata laluan?

AAH, Tunggu, saya INGAT SEKARANG!

Buat akaun

SUDAH MEMPUNYAI AKAUN?
AKADEMI SIJIL TEKNOLOGI MAKLUMAT EROPAH - MENGHADAPI KEMAHIRAN DIGITAL PROFESIONAL ANDA
  • MENDAFTARLAH
  • LOG MASUK
  • INFO

Akademi EITCA

Akademi EITCA

Institut Persijilan Teknologi Maklumat Eropah - EITCI ASBL

Pembekal Pensijilan

Institut EITCI ASBL

Brussels, Kesatuan Eropah

Mentadbir rangka kerja Pensijilan IT Eropah (EITC) untuk menyokong profesionalisme IT dan Masyarakat Digital

  • SIJIL
    • AKADEMI EITCA
      • KATALOG EITCA AKADEMI<
      • GRAFIK KOMPUTER EITCA/CG
      • KESELAMATAN MAKLUMAT EITCA/ADALAH
      • MAKLUMAT PERNIAGAAN EITCA/BI
      • KOMPETENSI UTAMA EITCA/KC
      • E-KERAJAAN EITCA/EG
      • PEMBANGUNAN WEB EITCA/WD
      • KEPENTINGAN ARTIFIK EITCA/AI
    • SIJIL EITC
      • KATALOG SIJIL EITC<
      • SIJIL GRAFIK KOMPUTER
      • SIJIL REKABENTUK WEB
      • SIJIL DESIGN 3D
      • SIJIL ITU PEJABAT
      • SIJIL BITCOIN BLOCKCHAIN
      • SIJIL PERKATAAN
      • SIJIL PLATFORM CLOUDBAHARU
    • SIJIL EITC
      • SIJIL INTERNET
      • SIJIL KRIPTOGRAFI
      • SIJIL PERNIAGAAN
      • SIJIL TELEWORK
      • SIJIL PROGRAM
      • SIJIL PORTRAIT DIGITAL
      • SIJIL PEMBANGUNAN WEB
      • SIJIL PEMBELAJARAN YANG LUAR BIASABAHARU
    • SIJIL UNTUK
      • PENTADBIRAN AWAM EU
      • GURU DAN PENDIDIK
      • PROFESIONAL KESELAMATAN ITU
      • Pereka & Grafik Grafik
      • PERNIAGAAN DAN PENGURUS
      • PEMBANGKANG BLOCKCHAIN
      • PEMBANGKANG WEB
      • PENGALAMAN AI CLOUDBAHARU
  • AKTIVITI
  • SUBSIDI
  • IKUT LANGKAH INI
  •   IT ID
  • TENTANG KAMI
  • HUBUNGI KAMI
  • ARAHAN SAYA
    Pesanan semasa anda kosong.
EITCIINSTITUTE
CERTIFIED

Apakah formula matematik bagi operasi lilitan pada imej 2D?

by Akademi EITCA / Khamis, 23 Mei 2024 / Disiarkan dalam Kepintaran Buatan, Pembelajaran Dalam Lanjutan EITC/AI/ADL, Penglihatan komputer yang maju, Rangkaian neural konvolusioner untuk pengecaman gambar

Operasi lilitan ialah proses asas dalam bidang rangkaian neural konvolusi (CNN), terutamanya dalam domain pengecaman imej. Operasi ini adalah penting dalam mengekstrak ciri daripada imej, membolehkan model pembelajaran mendalam memahami dan mentafsir data visual. Rumusan matematik operasi lilitan pada imej 2D adalah penting untuk memahami cara CNN memproses dan menganalisis imej.

Secara matematik, operasi lilitan untuk imej 2D boleh dinyatakan seperti berikut:

[ (I * K)(x, y) = sum_{i=-m}^{m} sum_{j=-n}^{n} I(x+i, y+j) cdot K(i, j ) ]

Di mana:
– ( I ) mewakili imej input.
– ( K ) menandakan kernel atau penapis.
– ( (x, y) ) ialah koordinat bagi piksel keluaran.
– ( m ) dan ( n ) ialah separuh lebar dan separuh tinggi isirong, masing-masing.

Dalam persamaan ini, kernel ( K ) meluncur ke atas imej input ( I ), melakukan pendaraban mengikut unsur dan menjumlahkan keputusan untuk menghasilkan nilai piksel output tunggal. Proses ini diulang untuk setiap piksel dalam peta ciri output, menghasilkan imej diubah yang menyerlahkan ciri khusus berdasarkan nilai kernel.

Operasi lilitan boleh difahami dengan lebih baik melalui contoh langkah demi langkah. Pertimbangkan kernel 3×3 ringkas ( K ) dan imej input 5×5 ( I ):

[ K = mula{bmatriks}
1 & 0 & -1 \
1 & 0 & -1 \
1 & 0 & -1
tamat{bmatriks} ] [ I = mula{bmatriks}
1 & 2 & 3 & 4 & 5 \
6 & 7 & 8 & 9 & 10 \
11 & 12 & 13 & 14 & 15 \
16 & 17 & 18 & 19 & 20 \
21 & 22 & 23 & 24 & 25
tamat{bmatriks} ]

Untuk mengira lilitan, kami meletakkan pusat kernel pada setiap piksel imej input dan melakukan langkah berikut:

1. Letakkan kernel: Letakkan bahagian tengah kernel di sudut kiri atas imej.
2. Pendaraban mengikut unsur: Darabkan setiap elemen kernel dengan elemen imej yang sepadan.
3. Penjumlahan: Jumlahkan hasil pendaraban mengikut unsur.
4. Gerakkan kernel: Alihkan kernel ke kedudukan seterusnya dan ulangi langkah 2-3.

Untuk kedudukan pertama (sudut kiri atas), pengiraan adalah seperti berikut:

[ mula {diselaraskan}
(I * K)(1, 1) &= (1 cdot 1) + (2 cdot 0) + (3 cdot -1) \
&quad + (6 cdot 1) + (7 cdot 0) + (8 cdot -1) \
&quad + (11 cdot 1) + (12 cdot 0) + (13 cdot -1) \
&= 1 + 0 – 3 + 6 + 0 – 8 + 11 + 0 – 13 \
&= -6
akhir{diselaraskan} ]

Keputusan ini, -6, ialah nilai peta ciri output pada kedudukan (1, 1). Mengulangi proses ini untuk setiap kedudukan kernel di atas imej input menjana keseluruhan peta ciri output.

Operasi lilitan biasanya disertai dengan konsep tambahan seperti pelapik dan langkah:

- padding: Menambah piksel tambahan di sekeliling sempadan imej input, selalunya dengan sifar (sifar-padding), untuk mengawal dimensi spatial peta ciri output. Padding memastikan bahawa peta ciri output mempunyai dimensi yang sama dengan imej input, mengekalkan maklumat spatial.
- Langkah: Saiz langkah yang mana kernel bergerak merentasi imej input. Langkah 1 bermakna kernel menggerakkan satu piksel pada satu masa, manakala langkah 2 bermakna kernel menggerakkan dua piksel pada satu masa. Stride mempengaruhi dimensi spatial peta ciri output, dengan langkah yang lebih besar menghasilkan dimensi output yang lebih kecil.

Dimensi keluaran operasi lilitan boleh dikira menggunakan formula berikut:

[ teks{Lebar Output} = frac lantai kiri{teks{Lebar Input} – teks{Lebar Kernel} + 2 teks cdot{Padding}}{text{Stride}} lantai kanan + 1 ] [ teks{Ketinggian Output} = frac lantai kiri{teks {Input Height} – teks{Ketinggian Kernel} + 2 teks cdot{Padding}}{text{Stride}} rightfloor + 1 ]

Formula ini memastikan bahawa dimensi spatial peta ciri output ditentukan dengan betul berdasarkan dimensi imej input, saiz kernel, pelapik dan langkah.

Dalam konteks rangkaian neural convolutional, berbilang lapisan convolutional disusun bersama, masing-masing dengan set kernel yang boleh dipelajari sendiri. Lapisan ini secara beransur-ansur mengekstrak ciri peringkat lebih tinggi daripada imej input, membolehkan rangkaian mengenali corak dan objek yang kompleks. Kernel dalam setiap lapisan dipelajari semasa proses latihan melalui perambatan balik, mengoptimumkan prestasi rangkaian pada tugasan yang diberikan.

Lapisan konvolusi sering diikuti oleh fungsi pengaktifan, seperti ReLU (Rectified Linear Unit), yang memperkenalkan bukan linear ke dalam model. Ketidak-linearan ini membolehkan rangkaian mempelajari perwakilan yang lebih kompleks. Selain itu, lapisan pengumpulan, seperti pengumpulan maksimum atau pengumpulan purata, digunakan untuk mengurangkan dimensi spatial peta ciri, menjadikan model lebih cekap dari segi pengiraan dan kurang terdedah kepada pemasangan berlebihan.

Contoh praktikal rangkaian saraf konvolusi untuk pengecaman imej ialah seni bina LeNet-5 yang terkenal, direka untuk pengecaman digit tulisan tangan. LeNet-5 terdiri daripada berbilang lapisan konvolusi dan gabungan, diikuti dengan lapisan bersambung sepenuhnya. Lapisan konvolusi mengekstrak ciri daripada imej input, manakala lapisan bersambung sepenuhnya melakukan pengelasan akhir.

Untuk menggambarkan operasi lilitan dalam konteks LeNet-5, pertimbangkan lapisan lilitan pertama, yang mengambil imej input 32×32 dan menggunakan enam biji 5×5 dengan langkah 1 dan tiada pelapik. Peta ciri keluaran mempunyai dimensi 28×28, dikira seperti berikut:

[ teks{Lebar Output} = frac lantai kiri{32 – 5 + 2 cdot 0}{1} lantai kanan + 1 = 28 ] [ teks{Ketinggian Output} = frac lantai kiri{32 – 5 + 2 cdot 0}{1} lantai kanan + 1 = 28 ]

Setiap satu daripada enam kernel menghasilkan peta ciri 28×28 yang berasingan, menangkap pelbagai aspek imej input. Peta ciri ini kemudiannya melalui fungsi pengaktifan ReLU dan lapisan pengumpulan maksimum 2×2 dengan langkah 2, menghasilkan peta ciri 14×14.

Lapisan seterusnya dalam LeNet-5 terus menggunakan operasi lilitan dan pengumpulan, secara beransur-ansur mengurangkan dimensi spatial sambil meningkatkan kedalaman peta ciri. Lapisan terakhir yang disambungkan sepenuhnya melakukan pengelasan berdasarkan ciri yang diekstrak, mengeluarkan kelas digit yang diramalkan.

Operasi lilitan ialah asas rangkaian neural konvolusi, membolehkan pengekstrakan ciri bermakna daripada imej. Rumusan matematik operasi lilitan melibatkan gelongsor kernel ke atas imej input, melakukan pendaraban mengikut unsur, dan menjumlahkan keputusan. Konsep tambahan seperti pelapik dan langkah memainkan peranan penting dalam mengawal dimensi spatial peta ciri keluaran. Lapisan konvolusi, digabungkan dengan fungsi pengaktifan dan lapisan pengumpulan, membentuk blok binaan model pengecaman imej yang berkuasa seperti LeNet-5, yang mampu mengenali corak dan objek kompleks dalam data visual.

Soalan dan jawapan terbaru lain mengenai Penglihatan komputer yang maju:

  • Apakah formula untuk fungsi pengaktifan seperti Unit Linear Dibetulkan untuk memperkenalkan bukan linear ke dalam model?
  • Apakah formula matematik untuk fungsi kehilangan dalam rangkaian saraf lilitan?
  • Apakah persamaan untuk pengumpulan maksimum?
  • Apakah kelebihan dan cabaran menggunakan konvolusi 3D untuk pengecaman tindakan dalam video, dan bagaimanakah set data Kinetik menyumbang kepada bidang penyelidikan ini?
  • Dalam konteks anggaran aliran optik, bagaimanakah FlowNet menggunakan seni bina penyahkod pengekod untuk memproses pasangan imej, dan apakah peranan yang dimainkan oleh set data Flying Chairs dalam melatih model ini?
  • Bagaimanakah leverage seni bina U-NET melangkau sambungan untuk meningkatkan ketepatan dan perincian output segmentasi semantik, dan mengapa sambungan ini penting untuk perambatan belakang?
  • Apakah perbezaan utama antara pengesan dua peringkat seperti Faster R-CNN dan pengesan satu peringkat seperti RetinaNet dari segi kecekapan latihan dan pengendalian komponen yang tidak boleh dibezakan?
  • Bagaimanakah konsep Intersection over Union (IoU) meningkatkan penilaian model pengesanan objek berbanding menggunakan kehilangan kuadratik?
  • Bagaimanakah sambungan baki dalam seni bina ResNet memudahkan latihan rangkaian saraf yang sangat dalam, dan apakah kesannya terhadap prestasi model pengecaman imej?
  • Apakah inovasi utama yang diperkenalkan oleh AlexNet pada tahun 2012 yang memajukan bidang rangkaian saraf konvolusi dan pengecaman imej dengan ketara?

Lihat lebih banyak soalan dan jawapan dalam penglihatan komputer Lanjutan

Lebih banyak soalan dan jawapan:

  • Bidang: Kepintaran Buatan
  • program: Pembelajaran Dalam Lanjutan EITC/AI/ADL (pergi ke program pensijilan)
  • Pelajaran: Penglihatan komputer yang maju (pergi ke pelajaran yang berkaitan)
  • Topic: Rangkaian neural konvolusioner untuk pengecaman gambar (pergi ke topik yang berkaitan)
Tagged under: Kepintaran Buatan, CNN, Kekusutan, Pengekstrakan Ciri, Pemprosesan imej, Kernel
Laman Utama » Kepintaran Buatan » Pembelajaran Dalam Lanjutan EITC/AI/ADL » Penglihatan komputer yang maju » Rangkaian neural konvolusioner untuk pengecaman gambar » » Apakah formula matematik bagi operasi lilitan pada imej 2D?

Pusat Persijilan

MENU PENGGUNA

  • Akaun saya

KATEGORI SIJIL

  • Pensijilan EITC (105)
  • Pensijilan EITCA (9)

Apa yang anda cari?

  • Pengenalan
  • Bagaimana ia berfungsi?
  • Akademi EITCA
  • Subsidi DSJC EITCI
  • Katalog EITC penuh
  • Pesanan anda
  • SOROTAN
  •   IT ID
  • Ulasan EITCA (Publ. Sederhana)
  • Mengenai Kami
  • Hubungi

Akademi EITCA ialah sebahagian daripada rangka kerja Pensijilan IT Eropah

Rangka kerja Pensijilan IT Eropah telah ditubuhkan pada tahun 2008 sebagai piawaian bebas vendor yang berpangkalan di Eropah dalam pensijilan dalam talian yang boleh diakses secara meluas bagi kemahiran dan kecekapan digital dalam banyak bidang pengkhususan digital profesional. Rangka kerja EITC dikawal oleh Institut Pensijilan IT Eropah (EITCI), pihak berkuasa pensijilan bukan untung yang menyokong pertumbuhan masyarakat maklumat dan merapatkan jurang kemahiran digital di EU.

Kelayakan untuk EITCA Academy 90% sokongan EITCI DSJC Subsidi

90% daripada yuran EITCA Academy disubsidi semasa pendaftaran oleh

    Pejabat Setiausaha Akademi EITCA

    Institut Pensijilan IT Eropah ASBL
    Brussels, Belgium, Kesatuan Eropah

    Operator Rangka Kerja Pensijilan EITC/EITCA
    Piawaian Pensijilan IT Eropah
    Mengakses borang hubungan ini, atau panggilan + 32 25887351

    Ikuti EITCI pada X
    Lawati Akademi EITCA di Facebook
    Berinteraksi dengan Akademi EITCA di LinkedIn
    Tonton video EITCI dan EITCA di YouTube

    Dibiayai oleh Kesatuan Eropah

    Dibiayai oleh Kumpulan Wang Pembangunan Wilayah Eropah (ERDF) dan juga Dana Sosial Eropah (ESF) dalam siri projek sejak 2007, kini ditadbir oleh Institut Pensijilan IT Eropah (EITCI) sejak 2008

    Dasar Keselamatan Maklumat | Dasar DSRRM dan GDPR | Dasar Perlindungan Data | Rekod Aktiviti Pemprosesan | Polisi HSE | Dasar Pencegahan Rasuah | Dasar Perhambaan Moden

    Terjemah secara automatik ke bahasa anda

    Terma dan Syarat | Polisi Privasi
    Akademi EITCA
    • Akademi EITCA di media sosial
    Akademi EITCA


    © 2008-2025  Institut Pensijilan IT Eropah
    Brussels, Belgium, Kesatuan Eropah

    TOP
    BERSEMBARA DENGAN SOKONGAN
    Adakah anda mempunyai sebarang pertanyaan?