იმისათვის, რომ პროგრამულად ამოიღოთ ლეიბლები სურათებიდან Python-ისა და Vision API-ის გამოყენებით, შეგიძლიათ გამოიყენოთ Google Cloud Vision API-ის ძლიერი შესაძლებლობები. Vision API უზრუნველყოფს გამოსახულების ანალიზის მახასიათებლების ყოვლისმომცველ კომპლექტს, მათ შორის ეტიკეტების ამოცნობას, რაც საშუალებას გაძლევთ ავტომატურად ამოიცნოთ და ამოიღოთ ეტიკეტები სურათებიდან.
დასაწყებად, თქვენ უნდა დააყენოთ Google Cloud პროექტი და ჩართოთ Vision API. მას შემდეგ რაც გააკეთებთ, შეგიძლიათ დააინსტალიროთ პითონის საჭირო ბიბლიოთეკები შემდეგი ბრძანების გაშვებით:
python pip install google-cloud-vision
შემდეგი, თქვენ უნდა დაადასტუროთ თქვენი აპლიკაცია Vision API-ზე წვდომისთვის. ამის გაკეთება შეგიძლიათ სერვისის ანგარიშის გასაღების შექმნით და `GOOGLE_APPLICATION_CREDENTIALS` გარემოს ცვლადის დაყენებით, რათა მიუთითოთ გასაღები ფაილის გზაზე. ეს შეიძლება გაკეთდეს შემდეგი კოდის გამოყენებით:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
ახლა თქვენ შეგიძლიათ გამოიყენოთ Vision API სურათებიდან ეტიკეტების პროგრამულად ამოსაღებად. შემდეგი კოდის ნაწყვეტი გვიჩვენებს, თუ როგორ უნდა გავაკეთოთ ეს:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
ამ კოდში, ჩვენ ჯერ ვქმნით `ImageAnnotatorClient` კლასის ეგზემპლარს `google.cloud.vision` ბიბლიოთეკიდან. შემდეგ ვკითხულობთ გამოსახულების ფაილს, ვქმნით `Image` ობიექტს ფაილის შინაარსიდან და ვაგზავნით Vision API-ში ლეიბლის აღმოსაჩენად. API პასუხი შეიცავს ეტიკეტების ანოტაციების ჩამონათვალს, საიდანაც ვიღებთ ეტიკეტების აღწერილობებს.
ახლა შეგიძლიათ გამოიძახოთ ფუნქცია `extract_labels` იმ სურათის ფაილის გზის გავლის გზით, რომლის ანალიზიც გსურთ. ის დააბრუნებს სურათიდან ამოღებულ ეტიკეტების სიას.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
ეს გამოსცემს ამოღებულ ეტიკეტებს სურათიდან.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API იყენებს მანქანური სწავლების მოწინავე მოდელებს სურათების გასაანალიზებლად და ობიექტების, სცენების და სხვა ვიზუალური მახასიათებლების იდენტიფიცირებისთვის. მას შეუძლია ზუსტად აღმოაჩინოს ეტიკეტების ფართო სპექტრი, რაც მას ღირებულ ინსტრუმენტად აქცევს სხვადასხვა აპლიკაციებისთვის, როგორიცაა სურათების კლასიფიკაცია, შინაარსის მოდერაცია და ვიზუალური ძებნა.
იმისათვის, რომ პროგრამულად ამოიღოთ ლეიბლები სურათებიდან Python-ისა და Vision API-ის გამოყენებით, თქვენ უნდა დააყენოთ Google Cloud პროექტი, ჩართოთ Vision API, დააინსტალიროთ Python-ის საჭირო ბიბლიოთეკები, დაადასტუროთ თქვენი აპლიკაცია და შემდეგ გამოიყენოთ Vision API ლეიბლის ამოცნობის შესასრულებლად. სურათები. ამოღებული ეტიკეტები შეიძლება გამოყენებულ იქნას შემდგომი ანალიზისთვის ან გამოსახულების შინაარსის გაგების გასაუმჯობესებლად.
სხვა ბოლოდროინდელი კითხვები და პასუხები EITC/AI/GVAPI Google Vision API:
- რა არის წინასწარ განსაზღვრული კატეგორია Google Vision API-ში ობიექტების ამოცნობისთვის?
- ჩართავს თუ არა Google Vision API სახის ამოცნობას?
- როგორ შეიძლება საჩვენებელი ტექსტის დამატება სურათზე ობიექტის საზღვრების დახატვისას "draw_vertices" ფუნქციის გამოყენებით?
- რა პარამეტრები აქვს მოწოდებულ კოდში "draw.line" მეთოდის და როგორ გამოიყენება ისინი წვეროების მნიშვნელობებს შორის ხაზების გასაფორმებლად?
- როგორ შეიძლება ბალიშის ბიბლიოთეკის გამოყენება Python-ში ობიექტების საზღვრების დასახაზად?
- რა დანიშნულება აქვს მოწოდებულ კოდში "draw_vertices" ფუნქციას?
- როგორ შეუძლია Google Vision API-ს დაგეხმაროთ გამოსახულების ფორმებისა და ობიექტების გაგებაში?
- როგორ შეუძლიათ მომხმარებლებს შეისწავლონ API-ს მიერ რეკომენდებული ვიზუალურად მსგავსი სურათები?
- რა სხვადასხვა ელემენტებია მოწოდებული Google Vision API-ის ვებ გამოვლენის ფუნქციის საპასუხო ობიექტში?
- როგორ ეხმარება Web Detection ფუნქცია ატვირთული სურათების ტეგების გენერირებაში?
იხილეთ მეტი კითხვა და პასუხი EITC/AI/GVAPI Google Vision API-ში