Untuk mengekstrak semua anotasi objek daripada respons API dalam bidang Kecerdasan Buatan – API Google Vision – Pemahaman imej lanjutan – Pengesanan objek, anda boleh menggunakan format respons yang disediakan oleh API, yang termasuk senarai objek yang dikesan bersama-sama dengannya. kotak sempadan dan markah keyakinan. Dengan menghuraikan respons ini, anda boleh mengekstrak anotasi objek yang dikehendaki.
Respons API biasanya terdiri daripada objek JSON yang mengandungi pelbagai medan, termasuk medan "localizedObjectAnnotations", yang mengandungi objek yang dikesan. Setiap anotasi objek termasuk maklumat seperti nama objek, koordinat kotak sempadannya dan skor keyakinan yang menunjukkan keyakinan API dalam pengesanan.
Untuk mengekstrak anotasi objek, anda boleh mengikuti langkah berikut:
1. Menghuraikan respons API: Mulakan dengan menghuraikan respons JSON yang diterima daripada API. Ini boleh dilakukan menggunakan perpustakaan penghuraian JSON atau fungsi terbina dalam yang disediakan oleh bahasa pengaturcaraan anda.
2. Akses medan "localizedObjectAnnotations": Setelah respons dihuraikan, akses medan "localizedObjectAnnotations", yang mengandungi objek yang dikesan. Medan ini biasanya merupakan tatasusunan anotasi objek.
3. Lelaran melalui anotasi objek: Lelaran melalui setiap anotasi objek dalam tatasusunan. Setiap anotasi mewakili objek yang dikesan dalam imej.
4. Ekstrak maklumat yang berkaitan: Ekstrak maklumat yang berkaitan daripada setiap anotasi objek, seperti nama objek, koordinat kotak sempadan dan skor keyakinan. Butiran ini boleh diakses sebagai medan berasingan dalam setiap anotasi objek.
5. Simpan atau proses maklumat yang diekstrak: Bergantung pada keperluan anda, anda boleh menyimpan maklumat yang diekstrak dalam struktur data atau memprosesnya selanjutnya untuk analisis atau tujuan lain. Sebagai contoh, anda mungkin ingin menyimpan nama objek dan koordinat kotak sempadan yang sepadan dalam pangkalan data atau menggunakannya untuk tugas pemahaman imej selanjutnya.
Berikut ialah contoh ringkas untuk menggambarkan proses pengekstrakan:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"pertengahan": "/m/01g317",
"nama": "kucing",
"skor": 0.89271355,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
] }
},
{
"pertengahan": "/m/04rky",
"nama": "anjing",
"skor": 0.8132468,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
Dalam contoh ini, kami menganggap respons JSON yang mengandungi dua objek yang dikesan: kucing dan anjing. Kod menghuraikan respons, mengakses medan "localizedObjectAnnotations", melelaran melalui setiap anotasi objek dan mengekstrak nama objek, koordinat kotak sempadan dan skor keyakinan. Akhir sekali, maklumat yang diekstrak dicetak, tetapi anda boleh mengubah suai kod untuk memenuhi keperluan khusus anda.
Dengan mengikuti langkah ini, anda boleh mengekstrak semua anotasi objek dengan berkesan daripada respons API dalam bidang Kecerdasan Buatan – API Google Vision – Pemahaman imej lanjutan – Pengesanan objek.
Soalan dan jawapan terbaru lain mengenai Pemahaman gambar lanjutan:
- Apakah beberapa kategori yang dipratentukan untuk pengecaman objek dalam Google Vision API?
- Apakah pendekatan yang disyorkan untuk menggunakan ciri pengesanan carian selamat dalam kombinasi dengan teknik penyederhanaan lain?
- Bagaimanakah kita boleh mengakses dan memaparkan nilai kemungkinan untuk setiap kategori dalam anotasi carian selamat?
- Bagaimanakah kita boleh mendapatkan anotasi carian selamat menggunakan API Google Vision dalam Python?
- Apakah lima kategori yang disertakan dalam ciri pengesanan carian selamat?
- Bagaimanakah ciri carian selamat API Google Vision mengesan kandungan eksplisit dalam imej?
- Bagaimanakah kita boleh mengenal pasti secara visual dan menyerlahkan objek yang dikesan dalam imej menggunakan perpustakaan bantal?
- Bagaimanakah kita boleh menyusun maklumat objek yang diekstrak dalam format jadual menggunakan bingkai data panda?
- Apakah perpustakaan dan bahasa pengaturcaraan yang digunakan untuk menunjukkan kefungsian API Google Vision?
- Bagaimanakah API Google Vision melaksanakan pengesanan dan penyetempatan objek dalam imej?
Lihat lebih banyak soalan dan jawapan dalam pemahaman imej lanjutan