ქართული სიტყვა III: ინტერვიუ ირაკლი გოგატიშვილთან ენის გაციფრულების შესახებ

გააზიარე:


ავტორები:

სოფიკო ქურდაძე

ანნა ამილახვარი

ზოი პოტამიტი

რედაქტორი: ბექა იობიძე

კორექტორები:

სოფიკო ქურდაძე

მარიამ გორდაძე

წინათქმა

ჟურნალი მდევარი“ წარმოგიდგენთ აკადემიურ ინტერვიუთა სერიას ქართული ენის ისტორიული შინაარსის, აწმყოსეული სახისა და სამომავლო საჭიროებათა შესახებ. მოცემულ სტატიაში ავტორები დარგის სპეციალისტებს ესაუბრებიან დროის დინების თანადროულად ენის ფორმაცვალების შესახებ.

ინტერვიუთა სერიის ამ მესამე ნაწილში ენის გაციფრულების საკითხის შესახებ მოპასუხეა “საქართველოს ბანკის” მონაცემთა კვლევითი ლაბორატორიის უფროსი ირაკლი გოგატიშვილი.


რას ნიშნავს კონკრეტული ენის ციფრულ სივრცეში არსებობა?

აქ მთავარი და მნიშვნელოვანი ის არის, რომ სამყარო ციფრულდება და ჩვენი ცხოვრების ყველა სფეროში შემოდის ციფრული ტექნოლოგიები. ენა, რაც უფრო მეტ სფეროში გამოიყენება, მით უფრო სიცოცხლისუნარიანია; თუ ასე არ იქნა, თავის დანიშნულებას დაკარგავს და დროთა განმავლობაში მოკვდება. შესაბამისად, ნებისმიერი ადამიანური ენის გაციფრულება მნიშვნელოვანია, რათა სიცოცხლე შეიძინოს, განვითარდეს ახალ სინამდვილეში – ახალ სამყაროში თავისი ადგილი და დანიშნულება ჰქონდეს.

ტერმინი „გაციფრულება, როგორც ასეთი, რას ნიშნავს, როგორ გვესმის, რას გულისხმობს?

ენის გაციფრულება შეიძლება ჩამოვაყალიბოთ, როგორც ენის გამანქანურება, – რაც ციფრული ტექნოლოგიაა, მასთან თავსებადი უნდა იყოს, იქ უნდა ჰქონდეს დანიშნულება. მაგალითად, ჩვენ ვაკვირდებით, რომ სულ უფრო და უფრო ვითარდება ციფრული თანაშემწე[1]. ისინი აღჭურვილნი არიან უნარით (შეზღუდული უნარით, თუმცა ეს უნარი უფრო და უფრო განვითარდება), გაიგონ ადამიანის მეტყველება მთელი თავისი ფსიქო-ემოციური ფონით და შესაბამისად უპასუხონ. ანუ, გაციფრულება, უპირველესად, გულისხმობს, რომ კომპიუტერმა ადამიანური მეტყველება გაიგოს, რაც შეიძლება მეტი სისრულით, და პასუხად შესაბამისი აზრი ადამიანური ენით შეთხზას. აქ იგულისხმება არა მხოლოდ წერილობითი მეტყველება, არამედ ხმის შერწყმაც[2]. უკვე ქართული ენისთვისაც არსებობს ხმის შემრწყმელი. რა თქმა უნდა, ისიც შეზღუდულია, თუმცა სულ უფრო და უფრო დაემსგავსება ადამიანის მეტყველებას. ადამიანის მეტყველების ციფრული ვერსია არის ენის გაციფრულება.

 მეტყველება, საზოგადოდ, მრავალშრიანია და ეს შრეები ამ გაციფრულების საკითხშიც მნიშვნელოვანია, ასასახია. შეგვიძლია ვრცლად იმაზე ვისაუბროთ, თუ რა არის შრეები. ერთი არის აზრობრივი შრე; მას თავისი შინაარსი აქვს, სათქმელის აზრს განსაზღვრავს, არის, ასევე, რაც ახლახან ვახსენე, ფსიქო-ემოციური შრე; ეს უკანასკნელი ხშირად შედარებით გასაგებად ხმით უფრო გადმოიცემა, ვიდრე სიტყვიერად. ენის აღქმის საკითხებში, მნიშვნელოვანია, რომ თითოეული შრე ათვისებული იყოს. გაციფრულება არის,- მანქანებს, ხელოვნურ სისტემებს რომ შეეძლოთ, ჯეროვნად გაიგონ ადამიანების ენა და ადამიანური პასუხი შეთხზან,- ასე შეგვიძლია შევაჯამოთ.

ცხადია, ის სისტემები, რომლებიც თქვენ ახსენეთ, მაგალითად, ციფრული თანაშემწე, რთულ ნაწილებს შეიცავს. რა არის ის წინაპირობები, რომლებმაც უნდა მიგვიყვანოს ამ რთულ სისტემებამდე?

ცხადია, არსებობს წინაპირობები. თითოეული სისტემა რთულია და არ არის მარტივი ტექნოლოგიით მიღწევადი. ციფრული თანაშემწის ორი ძირითადი საფუძველია – მეტყველება და აზროვნება: მეტყველება უნდა გაიგოს და აზრის წარმოქმნაც უნდა შეძლოს. ნაწილები, რომლებიც ამისათვის არის საჭირო, რა თქმა უნდა, მოიცავს ციფრულ ტექნოლოგიებს (რის საშუალებასაც ჩვენი ეკოსისტემა იძლევა). თანაშემწის შესაქმნელად კარგად უნდა გვესმოდეს ზოგადად ადამიანის მეტყველებისა და აზროვნების ბუნება: რა არის მისი არსი, როგორ მუშაობს. ეს ძალიან რთულია; ბოლომდე არ ვიცით, როგორ ვაზროვნებთ. ამას მეცნიერება მუდმივად სწავლობს. მიღწევის რა პირობებიც გვაქვს, იმ პირობებში უნდა მოვიცვათ ის სამეცნიერო ცოდნა, რომელიც კაცობრიობამ დააგროვა.

რა არის ამ ცოდნისა და გამოცდილების გამოყენებისთვის საჭირო?

საჭირო  არის მონაცემები[3]. არსებობს სისტემები, რომლებსაც ვაწყობთ მონაცემების საფუძველზე. მონაცემებს იყენებენ საშენ მასალადაც და შემდეგ საწვავადაც. მათი ხარისხი არის მნიშვნელოვანი. მონაცემების მოპოვებას, გაწმენდას, შესაბამის ფორმაში მოყვანას საკმაოდ დიდი ადამიანური და ტექნოლოგიური ძალისხმევა სჭირდება. შემდეგ, არსებობს დიდი ენის მოდელების[4] არქიტექტურები[5], რომლებიც შეიძლება ერთ თეორიულ ფუძეზე იყოს აღმოცენებული, მაგრამ აქ მნიშვნელოვანია ოსტატობა და ხელოვნება, თუ როგორ გამოიყენებ ამას. ყველაზე ხელსაყრელი გამოყენებაა, როცა   გამოთვლითი რესურსების დაზოგვით მიიღწევა სასურველი შედეგი. ანუ, ძალიან რესურსტევადი საქმიანობა და დარგია. ეს ყველაფერი შეზღუდული ოპტიმიზაციის ამოცანაა: კარგად უნდა განვსაზღვროთ, რა შეზღუდვები გვაქვს, რა არის შესაძლებლობების ზღვარი, თუ შეიძლება ამ შესაძლებლობების გაზრდა და ამ პირობებში, რა არის ჩვენი სამიზნე, რომლის რაც შეიძლება შედეგიან ათვისებასაც  უნდა შევეცადოთ. რაც შეიძლება შედეგიან ათვისებაში ვგულისხმობ მანქანისაგან ადამიანური მეტყველების ზედმიწევნით გაგებასა და პასუხის შესაბამისი სიზუსტით შეთხზვას. შესაძლებლობები განისაზღვრება გამოთვლითი, ადამიანური და ინფრასტრუქტურული რესურსებით. მხოლოდ ერთი კომპიუტერის რესურსი არ არის საკმარისი. არსებობს ამის მთელი ინფრასტრუქტურა, რომელსაც თავისი ნაწილები აქვს. მნიშვნელოვანია, ასევე, მიღებული შედეგის წარმოებაში ჩაშვება, „გაპროდუქტება“. შეიძლება, ძალიან მაგარი რამ გააკეთო, მაგრამ ის ვერ დაინერგოს, გამოუყენებელი დარჩეს. ასეთი საკითხები გასათვალისწინებელია.

ვიცით, რომ ხელოვნური ინტელექტის სისტემები არსებობს ინგლისურისა და სხვა დიდი ენებისთვის. ისინი ბევრი გვინახავს და მათთან ყოველდღიური შეხება გვაქვს. ისეთი მცირე რესურსის მქონე ენებისთვის, როგორიც ქართულია, რამდენად დიდი საფრთხეა ციფრული ტექნოლოგიების განვითარებისთვის ფეხის ვერ აწყობა? რა შედეგამდე შეიძლება მივიდეთ, თუ იგი ვერ დაეწევა ტექნოლოგიურ განვითარებას?

დიდი გამოწვევა და საფრთხეა, რომელსაც ყოველდღიურად ვაკვირდებით. ეს არის ის ტექნოლოგია, რომელიც ჩვენი ცხოვრების ყველა სფეროში აღწევს და თანდათანობით მთლიანად მოიცავს კაცობრიობის ყოფა-ცხოვრებას. თუ ენა ამასთან თავსებადი ვერ იქნება, მისი საჭიროება შემცირდება და, უკიდურეს შემთხვევაში, გაქრება. ენას შეიძლება აქვს საკმაოდ დიდი ლიტერატურული ტრადიცია და შეიძლება იყოს საკმაოდ განვითარებული, მოხდენილი, დახვეწილი, სხარტი, მაგრამ, თუ მისი საჭიროება აღარ არის, სხვა ენა თუ ჯაბნის საჭიროების თვალსაზრისით, ის თანდათანობით დაიჩრდილება და გაქრება. ამის მაგალითები ისტორიაშიც არის. ძველად ეს ისე ჩქარა არ ხდებოდა, როგორც დღეს. ახლა უფრო სწრაფად ვითარდება მოვლენები. ვიცით ენა, რომელიც იყო მოწინავე, მაგალითად, ლათინური დასავლური სამყაროსათვის. ლათინური გარდაიქმნა, სხვა ენებად იქცა. ის გამოიყენებოდა კათოლიკურ ეკლესიაში, მაგრამ არა ხალხის მიერ ყოველდღიურობაში. ეს ენა მოკვდა, უფრო სწორად, გარდაიქმნა. დიდი ხნის განმავლობაში უკვე ენებად ქცეული ხალხური ლათინურის დიალექტებს მათზე მეტყველი ხალხები ლათინურს უწოდებდნენ და დიალექტებადაც აღიქვამდნენ. მაგრამ ისინი ლათინური აღარ იყო, სხვა ენები იყო. შესაბამისად, შეიძლება ნებისმიერმა ენამ, მით უმეტეს ასე სწრაფად განვითარებადი მოვლენების პირობებში, უფრო მალე დაკარგოს დანიშნულება. ენას რა აცოცხლებს? – მისი საჭიროება. ადამიანებს უნდა უნდოდეთ ამ ენაზე მეტყველება. ცნობადობასაც ეს იწვევს და ა.შ. ანუ, თუ გჭირდება – იმ ენაზე იმეტყველებ, თუ არ გჭირდება – თანდათანობით, ნებსით თუ უნებლიედ, ის დაკარგავს თავის მნიშვნელობას. ეს საფრთხეა. ტექნოლოგიები ჩვენს ცხოვრებაში იმდენად სწრაფად აღწევს, რომ რომელი ენაც უფრო მალე „დაიპყრობს“ მათ და მეტად გამოყენებადი გახდება, თანდათანობით ის ენა გამოდევნის სხვა ენებს. ეს უკიდურესი სცენარია. რა თქმა უნდა, რაღაც შემთხვევებში უბრალოდ გარდაუვალი იქნება, რომ რომელიმე ენას ჰქონდეს წამყვანი როლი; თუმცა ეს არ ნიშნავს იმას, რომ მთლიანად ჩაანაცვლოს სხვა ენები.

თქვენ ახსენეთ ენის სიცოცხლე, რომელიც დამოკიდებულია ადამიანების სურვილზე, რომ ისაუბრონ ამ ენაზე. ამ მხრივ, დღეს ქართული ენის გადარჩენის საკითხი უფრო დგას თუ განვითარების?

მე მგონი, ერთი მეორეს არ გამორიცხავს. განვითარების გარეშე გადარჩენა შეუძლებელია. განვითარების საკითხი ნამდვილად დგას – ამის გარეშე ვერ გადავრჩებით, ვერ გადარჩება ჩვენი ენა. უნდა განვავითაროთ, გავაციფრულოთ იმისთვის, რომ გადარჩეს და მოწინავე როლი ჰქონდეს.

როგორც ვიცით, თქვენ მუშაობთ ხელოვნური ინტელექტის ლაბორატორიაში, ხართ მისი ხელმძღვანელი. შეგიძლიათ გაგვიმხილოთ, თუ რა კეთდება ტექნოლოგიურად იმისთვის, რომ ქართული ენა არ ჩამორჩეს თანამედროვეობას?

საოცარი გუნდი არის, რომელშიც მიწევს მოღვაწეობა. მათთან მუშაობა ერთი ბედნიერებაა. ეს აუცილებლად უნდა აღვნიშნო, ვიდრე უშუალოდ პასუხზე გადავიდოდე. აქ მოწადინებული ადამიანები არიან შეკრებილნი, რომლებსაც საზოგადოებრივი მიზნები ამოძრავებთ. მართლაც, სახალხო მისწრაფებაა, რომ ჩვენი ენა განვავითაროთ, ჩვენი ენა იყოს მოწინავე ენათა რიგში, ტექნოლოგიური იყოს. რა კეთდება? ჩვენ როცა დავიწყეთ ამაზე მუშაობა, უპირველესად, მოვიძიეთ, თუ რა შესაძლებლობები იყო მსოფლიო ბაზარზე და, რასაკვირველია, მივადექით ტექნოლოგიურ გიგანტებს, რათა კარგად შეგვესწავლა რას გვთავაზობდნენ. ვსაზღვრავდით, რა იყო საწყისი ნიშნული – საწყისი, საიდანაც უნდა დაგვეწყო სვლა. აღმოჩნდა, რომ ნულოვან ნიშნულზე ვიყავით. ცხადია, ნიშნული უფრო მაღლა რომ ყოფილიყო, გაგვიხარდებოდა და მაღალი წერტილიდან დავიწყებდით მოძრაობას, მაგრამ ასე არ აღმოჩნდა. ქართული ენის გაგების თვალსაზრისით სრული ყამირი დაგხვდა. ქართული ზეპირი მეტყველების გატექსტების კუთხითაც მსგავსი მდგომარეობა იყო. გადავწყვიტეთ, საკმაოდ გაბედული ნაბიჯი გადაგვედგა და თავად მოგვეკიდა ამ საქმისთვის ხელი. შეიკრიბა ენთუზიასტების ჯგუფი. მათ შორის, ერთ-ერთი კომერციული წამოწყება მნიშვნელოვნად მოღვაწეობდა ქართული ენის გაგების მანქანური ტექნოლოგიის დარგში. შედეგები იყო საკმაოდ მდარე, რადგან ნულიდან დაგვჭირდა ამ ყველაფრის დაწყება. დღეისთვის რაც გვაქვს, არის ინდუსტრიალიზებული ქართული ენის გამგები. ინდუსტრიალიზებული გულისხმობს იმას, რომ „საქართველოს ბანკის“ ჩატბოტშია გამოყენებული. ის თავიდან ბოლომდე ლაბორატორიაშია განვითარებული. საფუძვლად გამოყენებულია უკვე არსებული, დიდი[6] გარდამქმნელი, რომელიც გადავწრთვენით ქართული ენის საკმაოდ მასშტაბურიმოცულობის ენის კორპუსზე. ქართული მეტყველების გამტექსტებლისთვისაც ღია კოდის[7] მოდელი ასევე გადავწვრთვენით ჩვენს მონაცემებზე. აქ მნიშვნელოვანია აღინიშნოს, რომ გადამწყვეტი მნიშვნელობა აქვს მონაცემების ხარისხს. ისე არ ხდება, რომ რაღაც მონაცემები მოვიპოვოთ და სადღაც გავუშვათ, ალგორითმი გადავატაროთ და ასე შეიქმნას ტექნოლოგია. მონაცემის წინასწარ დამუშავებას ძალიან ღრმა ინტელექტუალური შრომა სჭირდება, – რამდენად კარგად გავწმენდთ, თუნდაც დავაჭდევთ, რასაც ზოგჯერ „დალეიბლებას“ უწოდებენ ჟარგონით. დაჭდევება და შესაბამის ტექნოლოგიურ ფორმატში გამზადება მნიშვნელოვანია, რათა შესაძლებელი იყოს მათი საწვრთნელ მონაცემებად გამოყენება. შემდეგ გამოწვევა არის მთელი გზის, გზაგამტარის აწყობა, დახარისხებული მონაცემის  იმ პლატფორმასთან შესაბამისობა, რომლის მეშვეობითაც იგი უნდა დაინერგოს[8]. ეს მრავალშრიანი ტექნოლოგიური განვითარებაა. ჩვენი ლაბორატორია, შეიძლება ითქვას, მნიშვნელოვნადაა ჩართული ყველა შრის განვითარებაში, „გაპროდუქტების“ ჩათვლით. შეიძლება დანერგვისას ყველაფერი ჩვენ მიერ არ კეთდებოდეს, მაგრამ, სულ მცირე, უნდა გვესმოდეს ეს ტექნოლოგია როგორ გამოიყენება და როგორ კეთდება, რათა საჭიროების შემთხვევაში ჩვენი ხელითაც შევძლოთ იგივე. ასეთი მიდგომა გვაქვს. აქ მნიშვნელოვანი ის არის, რომ ჩვენ არც ერთ ნაწილს არ ვუყურებთ ბრმად და რაღაც „შავ ყუთად“ არ აღვიქვამთ. გვინდა, რომ კარგად გვესმოდეს; და თუ არ გვესმის – ვსწავლობთ. კარგად ვერკვევით იმაში, რასაც ვაკეთებთ ყველა საფეხურზე, ყველა შრეში, თუნდაც ის ჩვენი ხელით არ კეთდებოდეს.

რაც შეეხება მონაცემების მომზადებასა და მოდელის შემუშავებას, ეს მთლიანად ჩვენს მხრებზეა და თავიდან ბოლომდე ლაბორატორიაში კეთდება. გზაგამტარიც, სადაც მონაცემების ნაკადი და დენაა, ჩვენთან კეთდება. დანერგვის ავტომატიზების ტექნოლოგიური მიდგომების ნაწილში სხვა გუნდები არიან ჩართული. ზოგ შემთხვევაში ჩვენც ვმონაწილეობთ, ვინაიდან მნიშვნელოვანია, რომ რიგიანად განხორციელდეს ჩანაფიქრი.

როგორ ფიქრობთ, აცნობიერებს ქართელი ხალხი, რომ საჭირო არის ამ ტექნოლოგიების განვითარება? თქვენი აზრით, მოსახლეობის რა ნაწილი შეიძლება იყოს, რომელიც ფიქრობს ამ საკითხებზე და უნდა, რომ ჩაერთოს ენის განვითარებაში?

რთული კითხვაა. სტატისტიკა, რა თქმა უნდა, არ მაქვს, თუმცა შემიძლია ვივარაუდო, რომ ამ საკითხზე საზოგადოების ძალიან მცირე ნაწილი ფიქრობს ობიექტური მიზეზების გამო. ჩვენთან არ არის ტექნოლოგიური ცოდნა იმდენად კარგი, რომ ამაზე ბევრმა შეძლოს ფიქრი. თანაც, ყოფითი პრობლემებით დატვირთულ ვითარებაში ამ ცოდნის შეტანა გამოწვევაა. განსაკუთრებული ძალისხმევა არის საჭირო იმისთვის, რომ ამ კუთხით განსწავლო საზოგადოება. ეს არ არის ტრაგედია. მე ვფიქრობ, რომ ის ნაწილი საზოგადოებისა, რომელიც ამაში ერკვევა და განსწავლულია (თამამად შემიძლია ვთქვა, რომ მსოფლიო სტანდარტების შესაბამისი ცოდნა არის საქართველოში), იმდენად გავლენიანი შეიძლება იყოს, რომ საზოგადოებრივი სიკეთე მოიტანოს. ამას ჩვენ დავინახავთ, თუ ქართული ენის მოდელს საკმაოდ მაღალი ხარისხით გავაკეთებთ, და ვაკეთებთ კიდეც. ეს ყველას გამოადგება, ვინც ამ ენაზე ვმეტყველებთ და ვისაც გვინდა, რომ ამ ენაზე, ჩვენს ენაზე, ვისაუბროთ.

ბოლო შეკითხვა უშუალოდ ჩვენს ციფრულ ჟურნალს ეხება. „მდევარში ჩვენი პოლიტიკაა, რომ არ დავუშვათ ბარბარიზმები, არასაჭირო ნეოლოგიზმები ჩვენს სივრცეში და ამით ქართული ენა შევინარჩუნოთ იმ სახით, როგორადაც მოვიდა ჩვენამდე. რამდენად ბუნებრივი გზა გვაქვს არჩეული ციფრული აკადემიური ჟურნალისთვის?

ვეთანხმები ამ მიდგომას. ცოტა განვავრცობ ამ თემას. ენის განვითარებაში ერთ-ერთი ურთულესი არის ტერმინოლოგიის საკითხი, რომელიც მოითხოვს დარგობრივი ცოდნის სათანადოდ გამოყენებას. ერთი არის, როცა არსებობს ცნება და მის ნაცვლად უცხოურ სინონიმს იყენებ, და მეორე არის, როდესაც ცნება არ არსებობს. არარსებობა უფრო დიდი გამოწვევაა. სხვათა შორის, ლაბორატორიაში ვცდილობთ ჩვენი დარგის ტერმინოლოგიის შექმნასაც, მაგალითად, „დალეიბლების“ ნაცვლად „დაჭდევება“, „ფაიფლაინის“ ნაცვლად „გზაგამტარი“. შეიძლება, არსებულ სიტყვებს ახალი მნიშვნელობა შევძინოთ. ამას ვუწოდებთ ცოდნის კოდირებას. შეიძლება სრულიად ახალი სიტყვა მოიგონო ენაში არსებული ფუძეებისგან, თუნდაც დიალექტური ან ქართველური ენების ფორმების საფუძველზე. ძალიან მნიშვნელოვანია, რომ ტერმინები შევქმნათ, ხოლო არსებული ქართული ტერმინები გამოვიყენოთ. ნასესხები ტერმინოლოგიაც, რა თქმა უნდა, ენის ნაწილია და შეიძლება გამოვიყენოთ; მას ენაში თავისი ადგილი აქვს. ამავდროულად, მნიშვნელოვანი არის, და ეს ჩემს მთავარ გზავნილადაც შეიძლება ჩაითვალოს, რომ ენაში უნდა იყოს კოდირებული ცნების შესაბამისი ცოდნა. ამ ენაზე უნდა გავიაზროთ, შევიმუშაოთ და განვავითაროთ ცოდნა. ესეც ენის ერთ-ერთი მაცოცხლებელია. თუ მისი ცოდნის შრე შეზღუდული და მწირია, ის, რა თქმა უნდა, ვერ შეეჭიდება რიგ ტექნოლოგიებსა თუ დარგებს, ვინაიდან უბრალოდ არ ექნება იმის რესურსი, რომ ამ დარგების წიაღში რაღაც თქვას. კარგია, რომ ცნებების ქართულ შესატყვისებს უპირატესობა ენიჭება, თუმცა მეორე საკითხია ახალი ცნებების შემუშავება და დამკვიდრება. ეს არ არის პარტიზანული საქმე. ამას საკმაოდ დიდი ძალისხმევა და მრავალი დარგის სპეციალისტების მუშაობა სჭირდება, რაც ერთ დროს უკვე შეძლეს ქართველებმა. დღესდღეობით ჩვენთვის ჩვეული უამრავი სიტყვა მათი ძალისხმევის გარეშე არ იარსებებდა. იგივე გვაქვს გასაკეთებელი და ეს უწყვეტად უნდა გაგრძელდეს, თუ გვინდა, რომ ჩვენი ენა იყოს ტექნოლოგიების, დარგების, ჩვენი ყოფა-ცხოვრების შესაბამისი. რა თქმა უნდა, თუ ცნება არ არსებობს, კარგია ვეცადოთ ამ ცნების შემუშავებას, დამკვიდრებასა და გამოყენებას. მასხრად არ უნდა ავიგდოთ. შეიძლება გაგვეცინოს, იუმორით შევხედოთ, მაგრამ არამც და არამც არ უნდა ავიგდოთ მასხრად. მე ასე მგონია, მოწადინებული უნდა ვიყოთ, შევიმუშაოთ ცნებები, შემდეგ გავავრცელოთ და დავამკვიდროთ. სწორედ ამის ნაწილი არის არსებული ქართული ცნებების გამოყენებაც.


[1] ციფრული თანაშემწე, ქართული შესატყვისი გავრცელებული პროგრამული ხელსაწყოსი – “Digital Assistant”.

[2] ხმის შერწყმა (Speech Synthesis) – მანქანისაგან ჟღერადი წინადადების შეთხზვა წერილობითი წინადადების საფუძველზე.

[3] მონაცემი – კომპიუტერულ მეცნიერებაში ერთი ან მეტი სიმბოლოს განურჩეველი მიმდევრობა, რომელიც მიდგომის შესაბამისად გარდაქმნადია ინფორმაციად.

[4] დიდი ენის მოდელი (LLM) – ენის ისეთი მოდელია, რომელიც ხასიათდება დიდი ზომით. თავის მხრივ “ენის მოდელი” (LM) სტატისტიკისა და ალბათობის კანონების გამოყენებით წინადადებაში განსაზღვრული სიტყვების მიმდევრობის აღმოჩენის ალბათობის განსაზღვრას აღნიშნავს.

[5]არქიტექტურა – განსაზღვრული კომპიუტერული სისტემის ყველა ფიზიკური და ლოგიკური ნაწილების ურთიერთკავშირის ზოგადი დასახელება.

[6] გარდამქმნელი (Transformer) – მანქანური სწავლების მოდელი, რომელიც ამუშავებს და თხზავს ადამიანურ ენას მანქანური ყურადღების (Attention) გამოყენებით.

[7]ღია კოდი –  საჯაროდ ხელმისაწვდომი (Open Source), სისტემის უკან დამალვის მაგიერ მსურველისათვის წაკითხვადი კოდი.

[8] დანერგვა – პროგრამული ნამუშევრის მოქმედებაში მოყვანა, აბსტრაქტული შემოქმედების განხორციელება.



მდევარი