კონვოლუციური ნერვული ქსელები (CNN) პირველად შეიქმნა კომპიუტერული ხედვის სფეროში გამოსახულების ამოცნობის მიზნით. ეს ქსელები არის ხელოვნური ნერვული ქსელის სპეციალიზებული ტიპი, რომელიც დაამტკიცა, რომ ძალიან ეფექტურია ვიზუალური მონაცემების ანალიზში. CNN-ების განვითარება განპირობებული იყო მოდელების შექმნის აუცილებლობით, რომლებსაც შეეძლოთ სურათების ზუსტად კლასიფიკაცია და კატეგორიზაცია, და მათმა წარმატებამ ამ დომენში გამოიწვია მათი ფართო გამოყენება სხვადასხვა სხვა აპლიკაციებში, როგორიცაა ობიექტების აღმოჩენა, გამოსახულების სეგმენტაცია და ბუნებრივი ენის დამუშავებაც კი.
CNN-ები შთაგონებულია ადამიანის ტვინში ვიზუალური ქერქის სტრუქტურითა და ფუნქციონალობით. ვიზუალური ქერქის მსგავსად, CNN შედგება ურთიერთდაკავშირებული ნეირონების მრავალი ფენისგან, რომლებიც ამუშავებენ შეყვანის მონაცემების სხვადასხვა ასპექტს. CNN-ების მთავარი ინოვაცია მდგომარეობს მათ უნარში, ავტომატურად ისწავლონ და ამოიღონ შესაბამისი ფუნქციები სურათებიდან, რაც გამორიცხავს ხელით ფუნქციების ინჟინერიის საჭიროებას. ეს მიიღწევა კონვოლუციური ფენების გამოყენებით, რომლებიც იყენებენ ფილტრებს შეყვანილ სურათზე, რათა აღმოაჩინონ სხვადასხვა ვიზუალური ნიმუშები და მახასიათებლები, როგორიცაა კიდეები, კუთხეები და ტექსტურები.
პირველი გარღვევა CNN-ებში მოვიდა LeNet-5 არქიტექტურის დანერგვით იან ლეკუნის და სხვების მიერ. 1998 წელს. LeNet-5 სპეციალურად შეიქმნა ხელნაწერი ციფრების ამოსაცნობად და მიაღწია შესანიშნავ ეფექტურობას MNIST მონაცემთა ბაზაში, საორიენტაციო მონაცემთა ნაკრები, რომელიც ფართოდ გამოიყენება გამოსახულების ამოცნობის ალგორითმების შესაფასებლად. LeNet-5-მა აჩვენა CNN-ების ძალა სურათების იერარქიული მახასიათებლების აღებაში, რაც საშუალებას იძლევა ზუსტი კლასიფიკაცია მასშტაბის, ბრუნვისა და თარგმანის ცვალებადობის შემთხვევაშიც კი.
მას შემდეგ CNN-ები მნიშვნელოვნად განვითარდა, უფრო ღრმა და რთული არქიტექტურის შემუშავებით. ერთ-ერთი მნიშვნელოვანი წინსვლა იყო AlexNet-ის არქიტექტურის დანერგვა ალექს კრიჟევსკის და სხვების მიერ. 2012 წელს. AlexNet-მა მიაღწია გარღვევას სურათების კლასიფიკაციაში ImageNet Large Scale Visual Recognition Challenge (ILSVRC) გამარჯვებით, წინა მიდგომებთან შედარებით შეცდომის მნიშვნელოვნად დაბალი კოეფიციენტით. ამ წარმატებამ გზა გაუხსნა CNN-ების ფართოდ გამოყენებას გამოსახულების ამოცნობის ამოცანებში.
CNN-ები ასევე წარმატებით იქნა გამოყენებული კომპიუტერული ხედვის სხვა ამოცანებისთვის. მაგალითად, ობიექტების გამოვლენისას, CNN შეიძლება გაერთიანდეს დამატებით შრეებთან, რათა მოხდეს ობიექტების ლოკალიზაცია და კლასიფიკაცია გამოსახულების შიგნით. ცნობილი რეგიონში დაფუძნებული კონვოლუციური ნერვული ქსელი (R-CNN), რომელიც შემოიღო როს გირშიკმა და სხვებმა. 2014 წელს არის ასეთი არქიტექტურის მაგალითი. R-CNN-მა მიაღწია უახლეს შედეგებს ობიექტების გამოვლენის ეტალონებზე CNN-ების სიმძლავრის გამოყენებით ფუნქციების ამოღების მიზნით და კომბინაციით რეგიონის შეთავაზების მეთოდებთან.
კონვოლუციური ნერვული ქსელები პირველად შეიქმნა კომპიუტერული ხედვის სფეროში გამოსახულების ამოცნობის ამოცანებისთვის. მათ მოახდინეს რევოლუცია სფეროში, ავტომატურად ისწავლეს შესაბამისი ფუნქციები სურათებიდან, აღმოფხვრა ხელით მახასიათებლების ინჟინერიის საჭიროება. CNN-ების განვითარებამ გამოიწვია მნიშვნელოვანი წინსვლა გამოსახულების კლასიფიკაციის, ობიექტების გამოვლენისა და კომპიუტერული ხედვის სხვა დავალებების მხრივ.
სხვა ბოლოდროინდელი კითხვები და პასუხები EITC/AI/ADL ღრმა სწავლა:
- რატომ გვჭირდება ოპტიმიზაციის გამოყენება მანქანათმცოდნეობაში?
- როდის ხდება ზედმეტი მორგება?
- შეუძლია თუ არა კონვოლუციურ ნერვულ ქსელებს გაუმკლავდეს თანმიმდევრულ მონაცემებს დროთა განმავლობაში კონვოლუციების ჩართვით, როგორც გამოიყენება Convolutional Sequence to Sequence მოდელებში?
- ეყრდნობა თუ არა გენერაციული წინააღმდეგობის ქსელები (GAN) გენერატორისა და დისკრიმინატორის იდეას?