კატალოგი
პოლიტიკა
ინტერვიუები
ამბები
საზოგადოება
მოდი, ვილაპარაკოთ
მოდა + დიზაინი
რელიგია
მედიცინა
სპორტი
კადრს მიღმა
კულინარია
ავტორჩევები
ბელადები
ბიზნესსიახლეები
გვარები
თემიდას სასწორი
იუმორი
კალეიდოსკოპი
ჰოროსკოპი და შეუცნობელი
კრიმინალი
რომანი და დეტექტივი
სახალისო ამბები
შოუბიზნესი
დაიჯესტი
ქალი და მამაკაცი
ისტორია
სხვადასხვა
ანონსი
არქივი
დეკემბერი 2019 (1)
ნოემბერი 2019 (207)
ოქტომბერი 2019 (245)
სექტემბერი 2019 (197)
აგვისტო 2019 (236)
ივლისი 2019 (209)

როგორ მოხვდება ქართული ენა ცნობილ კომპიუტერულ სისტემებში და როგორ აქცევს თქვენს ბგერებს კომპიუტერი ტექსტად

კომპიუტერული ტექნოლოგიების ხანაში  მაუსსა და კლავიატურას კომპიუტერთან ხმოვანი ურთიერთობა,  ეგრეთ წოდებული ხმოვანი  ბრძანებები  ანაცვლებს. დღეს ეს მხოლოდ მაღალტექნოლოგიური ქვეყნების ფუფუნება აღარ არის. ქართველმა მეცნიერმა ირაკლი ქარდავამ,  რომელიც რამდენიმე წელია, კომპიუტერულ ლინგვისტიკაზე მუშაობს, შექმნა კომპიუტერული პროგრამა, რომელიც კომპიუტერთან წარმოთქმულ სიტყვებს ტექსტებად აქცევს. პროგრამის სატესტო ვარიანტი უკვე მზადაა. მისი სრულყოფის შემდეგ, კომპიუტერი გაიგებს ნებისმიერი  ქართულად მოსაუბრე ადამიანის ხმას და  ქართული ენის კომპიუტერული ვარიანტი მოხვდება „გუგლსა” და სხვა  ცნობილ კომპიუტერულ სისტემებში.   ახალი კომპიუტერული ტექნოლოგიის დეტალებზე, მის  ავტორს, სოხუმის უნივერსიტეტის დოქტორანტს, ირაკლი ქარდავას გავესაუბრეთ. 

 

ირაკლი ქარდავა: რამდენიმე წელია, რაც კომპიუტერულ ლინგვისტიკაზე ვმუშაობ.  კონკრეტულად ამ პროგრამაზე მუშაობა კი, დაახლოებით, ოთხი თვის წინ დავიწყე. ამას წინ უძღოდა საკმაოდ საინტერესო შრომა პროგრამული  ენების მიმართულებით.  ჩვენი მთავარი მიზანი იყო, მოგვეხდინა ქართული ენის კომპიუტერული დამუშავება ზუსტად ისე, როგორც სხვა ენებია რეალიზებული კომპიუტერულ სისტემებში. ამ მიმართულებით, პარალელურად მუშაობდა სხვადასხვა ჯგუფი. მათაც საკმაოდ კარგი შედეგები აქვთ, მაგრამ ჩვენი მიდგომა განსხვავდებოდა იმით, რომ ჩვენი მიზანი გახლდათ, მიგვეღო სიტყვის უცვლელი ნაწილით ამ სიტყვის რაც კი არსებობს ყველა შესაძლო სწორი სიტყვა-ფორმა  ხელით აკრეფის გარეშე. უბრალოდ, ჩვენ მივაწვდით კომპიუტერს სიტყვის უცვლელ ნაწილს, პროგრამამ კი უნდა დააბრუნოს ყველა სწორი სიტყვა-ფორმა.  როდესაც საუბარია ბუნებრივი ენების კომპიუტერულ მოდელზე, ეს დაკავშირებულია მონაცემთა ბაზებთან, სადაც სიტყვის ყველა ფორმა შეჰყავთ ხელით.  ავიღოთ სიტყვა „წერა”. ქართულ ენაში ამ სიტყვას, თუ არ ვცდები, შვიდასამდე სიტყვა-ფორმა აქვს. თუ წერას ავიღებთ  სიტყვაში „ბედისწერა”, მივიღებთ უფრო მეტ ფორმას, რადგან აქ არსებით სახელ „წერას” დაემატება ბრუნვის ნიშნები, თანდებულები და ასე შემდეგ. წარმოიდგინეთ, ამდენი სიტყვის ბაზაში ხელით შეყვანა, სადაც შესაძლოა, შეცდომაც გაგვეპაროს და ყველა სწორ ფორმას ვერ მივაგნოთ. ლინგვისტი ქალბატონის, დამანა მელიქიშვილის მიერ შექმნილი, ქართული ზმნის სისტემის მეშვეობით, ჩვენ შევძელით, შეგვექმნა კომპიუტერული პროგრამა, რომლის მიხედვითაც, შესაძლებელია, სიტყვის უცვლელი ნაწილით მის გარშემო აგებული ყველა სწორი სიტყვა-ფორმის მოძიება კლავიატურაზე შეხების გარეშე. ეს იყო პროგრამის პირველი ეტაპი, რომელსაც შემდგომ მოჰყვა მორფოლოგიური სინთეზის შექმნა. ამ ორი კვლევის შემდეგ, ჩვენ გავაკეთეთ მოხსენებები პარიზსა და სინგაპურში, ამ გამოცდილებამ მოგვცა საშუალება, დაგვეწყო მუშაობა კომპიუტერულ პროგრამაზე, რომელიც დაკავშირებულია  ტექსტის ამოცნობასთან.  ეს  პროგრამა ძალიან პოპულარულია მსოფლიოს განვითარებულ ქვეყნებში, სადაც ყველაფერი უკვე იქით მიდის, რომ მაუსი და კლავიატურა კომპიუტერულ პროგრამებთან  ხმოვანმა ურთიერთობამ ჩაანაცვლოს.   

– თქვენი პროგრამა  მოიცავს ეგრეთ წოდებულ ხმოვან ბრძანებებს, უფრო დაწვრილებით მოგვიყევით ამ პროგრამის შესახებ.

– ეს პროგრამა უკვე მუშაობს მსოფლიოს განვითარებულ ქვეყნებში. დღეს კი შეგვიძლია ვთქვათ, რომ ჩვენ, ქართველებსაც გვაქვს ანალოგიური  პროგრამა, რომელიც შევქმენი სამეცნიერო ხელმძღვანელების მითითებებით. ესენი არიან ბატონი ჯემალ ანთიძე და ქალბატონი ნანა გულუა.  პროგრამა უკვე ჩაწერილია ჩემს კომპიუტერში – მე ვესაუბრები კომპიუტერს, მას ესმის ჩემი საუბარი, ჩემი ხმის აკუსტიკა და იმ სიტყვებს, რასაც წარმოვთქვამ,  აქცევს ტექსტად.  ბგერებს, რომელთაც ჩვენ წარმოვთქვამთ, ანუ  ფონემებს,  ხმის დაუშლელ ნაწილებს აქვთ შესაბამისი გრაფემა. ჩვენ წარმოვადგინეთ  პროგრამულად ბგერის  ციფრული სახე. ეს არის ელექტრონული რხევები.  შევისწავლეთ თითოეული ბგერის  მახასიათებელი, თუ   რა ციფრული ჩანაწერი შეიძლება არსებობდეს მისი შესაბამისი ჩვენი მიდგომით.  ამ პრინციპით, გავაძლიერეთ კვლევის  არსი და შედეგად მივიღეთ, რომ ჩვენ მიერ წარმოთქმულ სიტყვებს თუ წინადადებებს კომპიუტერი აღიქვამს ელექტრონული რხევებით. ეს კი გვაძლევს გრაფემების ერთობლიობას, რასაც ვუწოდებთ სიტყვას ან წინადადებას და წარმოითქმება კონკრეტულ მომენტში. იქიდან გამომდინარე, რომ ქართული ენის გრამატიკა საკმაოდ რთულია და ძალიან ბევრი სიტყვა-ფორმა აქვს,  შედეგის მისაღებად ძალიან გამოგვადგება ჩვენ მიერ ჩატარებული კვლევა, სწორი სიტყვა-ფორმების შესახებ. 

– კომპიუტერს რა ინტონაციით ან რა ფორმით უნდა „ვუთხრათ” სასურველი სიტყვა თუ ტექსტი, რომ  სასურველი „პასუხი” მივიღოთ?

– კომპიუტერს უნდა ესაუბროთ იმ ტონით, ინტონაციით, როგორც საუბრობთ ჩვეულებრივ, ბუნებრივ ენაზე.  თუ დავიძახეთ, ან დამარცვლით  წარმოვთქვით ესა თუ ის სიტყვა, ეს პროგრამის მაღალ დონეს არ ასახავს და ამით ვერავის გავაკვირვებთ. თუ კომპიუტერთან „საუბრის”  ცალკე მანერის გამომუშავება დაგვჭირდა, ეს უკვე გაართულებს საკითხს.  კომპიუტერს  ჩვეულებრივ ეტყვით: „გამარჯობა”, ის ბგერის დასრულებისთანავე, დაწერს ამ სიტყვას. ეს პროგრამა ჩვენს ხმას აქცევს ტექსტად ისე, რომ არ ეხებით კლავიატურას. მსოფლიოში არსებულ  ამ სისტემებს აქვს  ერთი   პრობლემა – ესაა აქცენტის თემა.  ამერიკელის საუბრის აკუსტიკური მოდელი ინგლისელის საუბრის აკუსტიკური მოდელისგან განსხვავებულია, ასეა ჩვენთანაც – თბილისური აქცენტით ნათქვამი სიტყვა, გურული ან მეგრელის მიერ იგივე სიტყვის წარმოთქმისას, სხვა აქცენტით ჟღერს, სიტყვაში ასოები კი ერთი და იგივეა. ჩემი მიდგომით  მოიხსნება აქცენტის პრობლემა და ერთიდაიგივე სიტყვა, თბილისელი წარმოთქვამს მას თუ გურული, ერთნაირად აღიქმება კომპიუტერის მიერ.  

– როგორც ჩემთვის ცნობილია, ამ ქართული ინოვაციის შესახებ, „გუგლისა” და სხვა ცნობილი კომპიუტერული ტექნოლოგიების კომპანიებია უკვე საქმის კურსში.

– „გუგლი” არის სისტემა, რომლისთვისაც პრიორიტეტულია ხმოვანი ბრძანებები და ამ ტიპის ტექნოლოგიები. იქ მუდმივად ვითარდება ეს მიმართულება.  მე ჯერ არ მქონია კომუნიკაცია „გუგლის” ადმინისტრაციის  ოფიციალურ წარმომადგენლობასთან, თუმცა „გუგლთან” ინტეგრირება არაა რთული. „გუგლი” არ არის დახურული სისტემა, პირიქით, გახსნილია ინოვაციებისთვის. ძალიან კარგი ურთიერთობა მაქვს ადამიანთან, რომლის მიდგომითაც მოხდა „გუგლ ვოისის” ჩამოყალიბება. მისთვის უკვე კარგად არის ცნობილი ჩემი პროგრამის შესახებ, რომლის სრულყოფის შემდეგაც, „გუგლის” სისტემაში ჩართული იქნება ქართული ენაც იმ ენების ჩამონათვალში, რომელსაც ის იყენებს. ეს პროგრამა  იქნება ქართული ტექნოლოგიური ინოვაციების აღიარება მსოფლიო დონეზე.   მომავალში ჩვენ შეგვიძლია, გამოვიყენოთ ეს შესაძლებლობა ხმოვანი ბრძანებებისთვის.  სისტემის სრულყოფილი  ჩამოყალიბების შემდეგ, შევქმნი პროგრამას, რომლის მიხედვითაც კომპიუტერი უპასუხებს თქვენს შეკითხვას: რომელი საათია? რა დღეა? და ასე შემდეგ. ახალი პროგრამა ძალიან ეფექტური  და მოსახერხებელი იქნება უნარშეზღუდული ადამიანებისთვის, მათთვის, ვისაც მხედვეობის პრობლემები აქვთ.  გახმოვანების საშუალება – უთხრან კომპიუტერს ამა თუ იმ საიტზე შესვლა და წაკითხვა, მათ ბევრად გაუადვილებთ ცხოვრებას. პროგრამა „წაუკითხავთ”  მათ სასურველ საიტს. 

– ერთი აკუსტიკური მოდელი მოიცავს მილიონობით სიტყვას, რაც ქართულ ლექსიკონში  არსებობს?

– ერთი აკუსტიკური მოდელი არ მოიცავს ყველა სიტყვას, მაგრამ მოიცავს ყველა იმ სიტყვას, რაც ორასი ხმის ჩანაწერში შევა. სიტყვების სწორი სიტყვა-ფორმების მიღება მოხდება  ზემოთ მოყვანილი ჩვენი კვლევის მეშვეობით. ის სიტყვები, რაც არ მოხვდება 200 ადამიანის ჩანაწერში, არ გვჭირდება გახმვონებული სახით. ისინი მოხვდება სიტყვების  ბაზაში, რომლის შექმნაც მოხდება იმ კორპუსებით, სადაც 4-5 მილიონი ქართული სიტყვაა შესული.  მოხდება ბაზების განახლება იმ სიტყვებით, რაც ლექსიკონში დროდადრო ჩნდება.  ეს არის ტექნიკური საკითხი. რაც მთავარია, არსებობს პროგრამა, რომელსაც აქვს პოტენციალი ხმა აქციოს ტექსტად. ჩვენ ვმუშაობთ ამ ვარიანტის შებრუნებულ ამოცანაზე, რომელთა გაერთიანებითაც შეგვეძლება, მივიღოთ დიალოგი კომპიუტერთან,  რაც გახდება კარგი საფუძველი ვიფიქროთ ხელოვნურ ინტელექტზე, რობოტიზებულ სისტემებზე... საქართველოში ამ მიმართულებით საკმაოდ დაბალ დონეზე ვართ, მაგრამ ჩვენ შეგვიძლია, დავიწყოთ ფიქრი ოჯახისთვის დამხმარე რობოტების შექმნაზე. ხმოვანი ბრძანებით ის თქვენი სურვილისამებრ, გააღებს ფანჯარას, დახურავს კარს. ასევე, შეიძლება, ხელოვნური ინტელექტის ჩამოყალიბების შედეგად, პროგრამას ვკითხოთ, როგორი ამინდია, რომელიმე ეკონომიკურ თემაზე გაგვიკეთოს პროგნოზი. გარემოს აღქმის მოდულის ჩართვის შემდეგ, ვკითხოთ, სწორად გვაქვს ტანსაცმლის ფერი შეხამებული  თუ არა და ასე შემდეგ.  

– ეს ალბათ, ძალიან შორეული პერსპექტივაა. როდის დაინერგება ახალი პროგრამა პრაქტიკაში?

–  ხელოვნური ინტელექტის თემა არ არის შორეული პერსპექტივა. ყველაფერს იმისთვის ვაკეთებთ, რომ აქამდე მივიდეთ. არსებობს  ვაკუუმი, რომელიც  უნდა შევავსოთ. თუმცა, ამ გამოგონებაში სახელმწიფოს დიდი თანადგომაა საჭირო.  რაც შეეხება ჩემს პროგრამას, მისი დანერგვა პრაქტიკაში  დამოკიდებულია იმ ადამიანთა რაოდენობაზე, ვინც იმუშავებს  ამ პროგრამის სრულყოფაზე. ჯერჯერობით შემუშავებულია სადემონსტრაციო ვარიანტი – პროგრამას  ესმის მხოლოდ ჩემი ხმა, რადგან ამ ეტაპზე ჩემი ხმის აკუსტიკური მოდელია შექმნილი. პროგრამის სრულყოფისთვის  საჭიროა ორასი ადამიანის, ქალის, ბავშვის, მოხუცი ქალისა და მამაკაცის განსხვავებული  ხმის ათ-ათწუთიანი ჩანაწერი.  ეს ხმები და ტექსტი დახარისხდება პროგრამულად, მიებმება მას, რის შედეგადაც მივიღებთ აკუსტიკურ მოდელს.  როდესაც მოვახდენთ ხმების კონსოლიდაციას და მივიღებთ უნივერსალურ ხმას,  შეგვიძლია ჩავთვალოთ, რომ პროგრამა სრულყოფილია. კომპიუტერი გაიგებს ნებისმიერი  ქართულად მოსაუბრე ადამიანის ხმას. მისი გამოყენება შესაძლებელი გახდება ყველა სისტემისთვის, მათ შორის „აიფონებისთვის.” ვფიქრობ, განსხვავებული იქნება ამ პროგრამაზე წვდომა კერძო პირებისა და კომპანიებისთვის. ეს პროგრამა მათ გაუიოლებთ სამუშაო რეჟიმს. ძალიან მინდა, პროგრამის სრულყოფაში  ჩავრთოთ  წარჩინებული სტუდენტები. ეს ჩემთვის ძალიან მნიშვნელოვანი თემაა, რადგან საკუთარ თავზე მაქვს გამოცდილი სტუდენტის სურვილი, ჰქონდეს გარემო, რაც მას  პროფესიული განვითარების საშუალებას მისცემს.   

 

скачать dle 11.3