როგორ შეგიძლიათ პროგრამულად ამოიღოთ ლეიბლები სურათებიდან Python-ისა და Vision API-ის გამოყენებით?

by EITCA აკადემია / ოთხშაბათს, 27 დეკემბერი 2023 / გამოქვეყნებულია ხელოვნური ინტელექტი, EITC/AI/GVAPI Google Vision API, სურათების მარკირება, იარლიყების გამოვლენა, გამოცდის მიმოხილვა

იმისათვის, რომ პროგრამულად ამოიღოთ ლეიბლები სურათებიდან Python-ისა და Vision API-ის გამოყენებით, შეგიძლიათ გამოიყენოთ Google Cloud Vision API-ის ძლიერი შესაძლებლობები. Vision API უზრუნველყოფს გამოსახულების ანალიზის მახასიათებლების ყოვლისმომცველ კომპლექტს, მათ შორის ეტიკეტების ამოცნობას, რაც საშუალებას გაძლევთ ავტომატურად ამოიცნოთ და ამოიღოთ ეტიკეტები სურათებიდან.

დასაწყებად, თქვენ უნდა დააყენოთ Google Cloud პროექტი და ჩართოთ Vision API. მას შემდეგ რაც გააკეთებთ, შეგიძლიათ დააინსტალიროთ პითონის საჭირო ბიბლიოთეკები შემდეგი ბრძანების გაშვებით:

python
pip install google-cloud-vision

შემდეგი, თქვენ უნდა დაადასტუროთ თქვენი აპლიკაცია Vision API-ზე წვდომისთვის. ამის გაკეთება შეგიძლიათ სერვისის ანგარიშის გასაღების შექმნით და `GOOGLE_APPLICATION_CREDENTIALS` გარემოს ცვლადის დაყენებით, რათა მიუთითოთ გასაღები ფაილის გზაზე. ეს შეიძლება გაკეთდეს შემდეგი კოდის გამოყენებით:

python
import os
from google.cloud import vision

os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'

ახლა თქვენ შეგიძლიათ გამოიყენოთ Vision API სურათებიდან ეტიკეტების პროგრამულად ამოსაღებად. შემდეგი კოდის ნაწყვეტი გვიჩვენებს, თუ როგორ უნდა გავაკეთოთ ეს:

python
def extract_labels(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)
    response = client.label_detection(image=image)
    labels = response.label_annotations

    extracted_labels = [label.description for label in labels]

    return extracted_labels

ამ კოდში, ჩვენ ჯერ ვქმნით `ImageAnnotatorClient` კლასის ეგზემპლარს `google.cloud.vision` ბიბლიოთეკიდან. შემდეგ ვკითხულობთ გამოსახულების ფაილს, ვქმნით `Image` ობიექტს ფაილის შინაარსიდან და ვაგზავნით Vision API-ში ლეიბლის აღმოსაჩენად. API პასუხი შეიცავს ეტიკეტების ანოტაციების ჩამონათვალს, საიდანაც ვიღებთ ეტიკეტების აღწერილობებს.

ახლა შეგიძლიათ გამოიძახოთ ფუნქცია `extract_labels` იმ სურათის ფაილის გზის გავლის გზით, რომლის ანალიზიც გსურთ. ის დააბრუნებს სურათიდან ამოღებულ ეტიკეტების სიას.

python
image_path = '/path/to/image.jpg'
labels = extract_labels(image_path)
print(labels)

ეს გამოსცემს ამოღებულ ეტიკეტებს სურათიდან.

plaintext
['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']

Vision API იყენებს მანქანური სწავლების მოწინავე მოდელებს სურათების გასაანალიზებლად და ობიექტების, სცენების და სხვა ვიზუალური მახასიათებლების იდენტიფიცირებისთვის. მას შეუძლია ზუსტად აღმოაჩინოს ეტიკეტების ფართო სპექტრი, რაც მას ღირებულ ინსტრუმენტად აქცევს სხვადასხვა აპლიკაციებისთვის, როგორიცაა სურათების კლასიფიკაცია, შინაარსის მოდერაცია და ვიზუალური ძებნა.

იმისათვის, რომ პროგრამულად ამოიღოთ ლეიბლები სურათებიდან Python-ისა და Vision API-ის გამოყენებით, თქვენ უნდა დააყენოთ Google Cloud პროექტი, ჩართოთ Vision API, დააინსტალიროთ Python-ის საჭირო ბიბლიოთეკები, დაადასტუროთ თქვენი აპლიკაცია და შემდეგ გამოიყენოთ Vision API ლეიბლის ამოცნობის შესასრულებლად. სურათები. ამოღებული ეტიკეტები შეიძლება გამოყენებულ იქნას შემდგომი ანალიზისთვის ან გამოსახულების შინაარსის გაგების გასაუმჯობესებლად.

სხვა ბოლოდროინდელი კითხვები და პასუხები EITC/AI/GVAPI Google Vision API:

იხილეთ მეტი კითხვა და პასუხი EITC/AI/GVAPI Google Vision API-ში

მეტი კითხვა და პასუხი:

საველე: ხელოვნური ინტელექტი
პროგრამა: EITC/AI/GVAPI Google Vision API (გადადით სასერტიფიკაციო პროგრამაზე)
გაკვეთილი: სურათების მარკირება (გადადით შესაბამის გაკვეთილზე)
თემა: იარლიყების გამოვლენა (გადადით შესაბამის თემაზე)
გამოცდის მიმოხილვა

Tagged ქვეშ: ხელოვნური ინტელექტი, Google Cloud, გამოსახულების ანალიზი, ლეიბლის გამოვლენა, Python, Vision API

EITCA აკადემია

როგორ შეგიძლიათ პროგრამულად ამოიღოთ ლეიბლები სურათებიდან Python-ისა და Vision API-ის გამოყენებით?

სხვა ბოლოდროინდელი კითხვები და პასუხები EITC/AI/GVAPI Google Vision API:

მეტი კითხვა და პასუხი:

EITCA აკადემია არის ევროპული IT სერტიფიცირების ჩარჩოს ნაწილი

EITCA აკადემიის უფლება 80% EITCI DSJC სუბსიდიის მხარდაჭერა

EITCA აკადემია

შედით თქვენს ანგარიშზე, თქვენი სახელი ან ელექტრონული ფოსტის მისამართი

დაიშალოთ თქვენი მონაცემები?

ანგარიშის შექმნა

როგორ შეგიძლიათ პროგრამულად ამოიღოთ ლეიბლები სურათებიდან Python-ისა და Vision API-ის გამოყენებით?

სხვა ბოლოდროინდელი კითხვები და პასუხები EITC/AI/GVAPI Google Vision API:

მეტი კითხვა და პასუხი:

EITCA აკადემიის უფლება 80% EITCI DSJC სუბსიდიის მხარდაჭერა