Seni bina rangkaian saraf yang digunakan dalam contoh ialah rangkaian neural suapan dengan tiga lapisan: lapisan input, lapisan tersembunyi dan lapisan output. Lapisan input terdiri daripada 784 unit, yang sepadan dengan bilangan piksel dalam imej input. Setiap unit dalam lapisan input mewakili nilai keamatan piksel dalam imej.
Lapisan tersembunyi terdiri daripada 128 unit, yang disambungkan sepenuhnya ke lapisan input. Setiap unit dalam lapisan tersembunyi mengira jumlah wajaran input daripada lapisan input dan menggunakan fungsi pengaktifan untuk menghasilkan output. Dalam contoh ini, fungsi pengaktifan yang digunakan dalam lapisan tersembunyi ialah fungsi unit linear diperbetulkan (ReLU). Fungsi ReLU ditakrifkan sebagai f(x) = max(0, x), dengan x ialah jumlah wajaran input kepada unit. Fungsi ReLU memperkenalkan bukan lineariti kepada rangkaian, membolehkannya mempelajari corak dan perhubungan yang kompleks dalam data.
Lapisan keluaran terdiri daripada 10 unit, setiap satu mewakili salah satu kelas yang mungkin dalam masalah pengelasan. Unit dalam lapisan keluaran juga disambungkan sepenuhnya kepada unit dalam lapisan tersembunyi. Sama seperti lapisan tersembunyi, setiap unit dalam lapisan keluaran mengira jumlah wajaran input daripada lapisan tersembunyi dan menggunakan fungsi pengaktifan. Dalam contoh ini, fungsi pengaktifan yang digunakan dalam lapisan keluaran ialah fungsi softmax. Fungsi softmax menukarkan jumlah wajaran input kepada taburan kebarangkalian ke atas kelas, di mana jumlah kebarangkalian adalah sama dengan 1. Unit dengan kebarangkalian tertinggi mewakili kelas ramalan imej input.
Untuk meringkaskan, seni bina rangkaian saraf yang digunakan dalam contoh terdiri daripada lapisan input dengan 784 unit, lapisan tersembunyi dengan 128 unit menggunakan fungsi pengaktifan ReLU, dan lapisan output dengan 10 unit menggunakan fungsi pengaktifan softmax.
Soalan dan jawapan terbaru lain mengenai Membina rangkaian saraf untuk melakukan klasifikasi:
- Adakah perlu menggunakan fungsi pembelajaran tak segerak untuk model pembelajaran mesin yang dijalankan dalam TensorFlow.js?
- Bagaimanakah model disusun dan dilatih dalam TensorFlow.js, dan apakah peranan fungsi kehilangan rentas entropi kategori?
- Apakah kepentingan kadar pembelajaran dan bilangan zaman dalam proses pembelajaran mesin?
- Bagaimanakah data latihan dibahagikan kepada set latihan dan ujian dalam TensorFlow.js?
- Apakah tujuan TensorFlow.js dalam membina rangkaian saraf untuk tugas klasifikasi?