Pembelajaran diselia dan tidak diselia ialah dua jenis asas paradigma pembelajaran mesin yang mempunyai tujuan yang berbeza berdasarkan sifat data dan objektif tugasan. Memahami masa untuk menggunakan latihan diselia berbanding latihan tidak diselia adalah penting dalam mereka bentuk model pembelajaran mesin yang berkesan. Pilihan antara dua pendekatan ini bergantung pada ketersediaan data berlabel, hasil yang diingini dan struktur asas set data.
Pembelajaran diselia ialah sejenis pembelajaran mesin yang model dilatih pada set data berlabel. Dalam pembelajaran diselia, algoritma belajar untuk memetakan data input kepada output yang betul dengan dibentangkan dengan contoh latihan. Contoh latihan ini terdiri daripada pasangan input-output, di mana data input disertakan dengan output yang betul atau nilai sasaran yang sepadan. Matlamat pembelajaran diselia adalah untuk mempelajari fungsi pemetaan daripada pembolehubah input kepada pembolehubah output, yang kemudiannya boleh digunakan untuk membuat ramalan pada data yang tidak kelihatan.
Pembelajaran diselia biasanya digunakan apabila output yang dikehendaki diketahui dan matlamatnya adalah untuk mempelajari hubungan antara pembolehubah input dan output. Ia biasanya digunakan dalam tugas seperti klasifikasi, di mana matlamatnya adalah untuk meramalkan label kelas kejadian baharu, dan regresi, di mana matlamatnya adalah untuk meramalkan nilai berterusan. Sebagai contoh, dalam senario pembelajaran yang diselia, anda boleh melatih model untuk meramalkan sama ada e-mel adalah spam atau tidak berdasarkan kandungan e-mel dan status spam/bukan spam berlabel e-mel sebelumnya.
Sebaliknya, pembelajaran tanpa pengawasan ialah sejenis pembelajaran mesin di mana model dilatih pada set data tidak berlabel. Dalam pembelajaran tanpa pengawasan, algoritma mempelajari corak dan struktur daripada data input tanpa maklum balas yang jelas tentang output yang betul. Matlamat pembelajaran tanpa pengawasan adalah untuk meneroka struktur asas data, menemui corak tersembunyi dan mengekstrak cerapan bermakna tanpa memerlukan data berlabel.
Pembelajaran tanpa pengawasan biasanya digunakan apabila matlamatnya adalah untuk meneroka data, mencari corak tersembunyi dan mengumpulkan titik data yang serupa bersama-sama. Ia sering digunakan dalam tugas seperti pengelompokan, di mana matlamatnya adalah untuk mengumpulkan titik data yang serupa ke dalam kelompok berdasarkan ciri mereka, dan pengurangan dimensi, di mana matlamatnya adalah untuk mengurangkan bilangan ciri sambil mengekalkan maklumat penting dalam data. Sebagai contoh, dalam senario pembelajaran tanpa seliaan, anda boleh menggunakan pengelompokan untuk mengumpulkan pelanggan berdasarkan gelagat pembelian mereka tanpa pengetahuan awal tentang segmen pelanggan.
Pilihan antara pembelajaran diselia dan tidak diselia bergantung kepada beberapa faktor. Jika anda mempunyai set data berlabel dan ingin meramalkan hasil tertentu, pembelajaran diselia ialah pilihan yang sesuai. Sebaliknya, jika anda mempunyai set data tidak berlabel dan ingin meneroka struktur data atau mencari corak tersembunyi, pembelajaran tanpa pengawasan adalah lebih sesuai. Dalam sesetengah kes, gabungan kedua-dua teknik diselia dan tidak diselia, yang dikenali sebagai pembelajaran separa penyeliaan, boleh digunakan untuk memanfaatkan faedah kedua-dua pendekatan.
Keputusan untuk menggunakan latihan diselia berbanding latihan tidak diselia dalam pembelajaran mesin bergantung pada ketersediaan data berlabel, sifat tugasan dan hasil yang diinginkan. Memahami perbezaan antara pembelajaran diselia dan tidak diselia adalah penting untuk mereka bentuk model pembelajaran mesin yang berkesan yang boleh mengekstrak cerapan bermakna dan membuat ramalan yang tepat daripada data.
Soalan dan jawapan terbaru lain mengenai Pembelajaran Mesin Awan Google EITC/AI/GCML:
- Apakah teks kepada pertuturan (TTS) dan cara ia berfungsi dengan AI?
- Apakah batasan dalam bekerja dengan set data besar dalam pembelajaran mesin?
- Bolehkah pembelajaran mesin melakukan beberapa bantuan dialog?
- Apakah taman permainan TensorFlow?
- Apakah maksud set data yang lebih besar sebenarnya?
- Apakah beberapa contoh hiperparameter algoritma?
- Apakah pembelajaran ensemble?
- Bagaimana jika algoritma pembelajaran mesin yang dipilih tidak sesuai dan bagaimana seseorang boleh memastikan untuk memilih yang betul?
- Adakah model pembelajaran mesin memerlukan penyeliaan semasa latihannya?
- Apakah parameter utama yang digunakan dalam algoritma berasaskan rangkaian saraf?
Lihat lebih banyak soalan dan jawapan dalam Pembelajaran Mesin Awan Google EITC/AI/GCML