Bugünkü mövzu süni intellektin Afrika dillərinə yönəlik təşəbbüsləri haqqında olacaq. Əsrlər boyu Afrika qitəsinə yönəlmiş laqeydliyin artıq sona çatmaq üzrə olub-olmadığını müəyyənləşdirmək üçün bu gün süni intellekt sahəsində kənarda qalmış Afrika dillərinə diqqət yetiriləcək. Bu çərçivədə, həmin dillər üçün ortaya çıxan yeni mübarizənin ümidverici hekayəsindən bəhs etmək istəyirik.
2016-cı ildə “Google” şirkətinin baş icraçı direktoru Sundar Piçai bir məsələdə vəd vermişdi. O, süni intellektin məlumatı dil fərqindən asılı olmayaraq hər kəs üçün “universal şəkildə əlçatan” edəcəyini söyləmişdi.
O vaxtdan bəri bu vəd hər təkrarlandıqca dünyanın dörd bir yanında insanların gözləntiləri artdı. İnsanlarda artıq texnologiyanın dil maneələrini aşacağı və hər kəsin məlumata bərabər hüquqda çıxış əldə edəcəyi ümidi yarandı. Ancaq Afrikada danışılan iki mindən artıq dildən birini istifadə edənlər üçün bu vəd hələ də uzaqda olan bir xəyaldan ibarətdir.
Təsəvvür edin ki, dünyada həftəlik 800 milyon aktiv istifadəçisi olan “ChatGPT” proqramı 94 milyondan çox nigeriyalının danışdığı hausa dilində yazılmış cümlələrin cəmi 10–20 faizini qavrayaraq qəbul edir. Qeyd edək ki, eyni vəziyyət milyonlarla insanın danışdığı yoruba, iqbo, suahili və somali kimi digər Afrika dilləri üçün də keçərlidir.
Bəs bu qədər geniş yayılmış dillər niyə dövrümüzün ən güclü süni intellekt alətləri tərəfindən nəzərə alınmır? Bu sualın cavabı tədqiqatçıların “az resurslu dillər” adlandırdığı səbəblə izah olunur.
Bu anlayış həmin dillərdə mövcud olan internet-saytların, kitabların və transkriptlərin, yəni onlayn mənbələrin azlığını ifadə edir. Böyük dil modelləri öyrənmək və mətn yaratmaq üçün iri həcmli rəqəmsal məlumatlardan istifadə edir. Lakin bu məlumatların böyük əksəriyyəti ingilis dilində və ya dünyada geniş yayılan bir neçə Avropa dillərində mövcuddur.
Məsələylə bağlı Kaliforniya Universitetinin dilçilik üzrə tədqiqatçısı Hellina Haylu Niqatunun sözləri diqqət çəkir: “İrəliləyişin necə qiymətləndirildiyi və tədqiqatın hansı istiqamətdə aparıldığı əsasən Qərb dillərində əldə olunan nəticələrə görə müəyyənləşdirilir. Afrika dilləri “az resurslu” dillər kimi təsnif edilir və buna görə də çox vaxt diqqətsiz qalır. Hətta bu dildə bir məlumat daxil edildikdə belə, sistem zəif nəticə göstərir.”
Amma bu təkcə texniki bir məsələ deyil. Burada kommersiya maraqları, qərəzli yanaşma və maliyyət problemləri də rol oynayır. Belə ki, Afrika dilləri üzrə əldə edilə biləcək iqtisadi gəlirin məhdud hesab olunması səbəbindən, şirkətlər bu dillər üçün süni intellekt dəstəyini inkişaf etdirməyə vaxt və resurs ayırmağa maraq göstərmirlər.
Daha pisi isə odur ki, araşdırmalar Latın əlifbasından istifadə etməyən dillərin məşhur süni intellekt alətlərində ingilis və ya fransız dilləri ilə müqayisədə daha baha başa gəldiyini göstərir. Yəni ödəmə gücü aşağı olan istifadəçilər eyni həcmdə mətni emal etmək üçün daha çox pul ödəyir və çox vaxt daha az etibarlı nəticələr alırlar.
Xoşbəxtlikldən bu məsələylə bağlı sevindirici xəbərlər də var! Belə ki, Afrikanın rəqəmsal müstəqilliyi üçün əhəmiyyətli bir təşəbbüs həyata keçirilir. “Gates Foundation” tərəfindən ayrılmış 2,2 milyon dollarlıq qrantla maliyyələşdirilən “African Next Voices” layihəsi.
Bu layihə indiyədək bir neçə Afrika dili üçün ən böyük süni intellektə uyğun dil məlumat bazası yaratmaq cəhdini təmsil edir. Məsələylə bağlı qitə üzrə tədqiqatçılar artıq işi öz əllərinə alıblar. Daha onlar Silikon vadisinin diqqətini gözləmirlər. Nigeriya, Keniya və Cənubi Afrikada 18 dildə 9 min saatlıq danışıq qeydə alınıb və bu materiallar rəqəmsal məlumat bazasına çevrilib.
Bu barədə “Data Science Nigeria” təşkilatının texnologiya direktoru İfe Adebaranın sözləri ümidvericidir: “Bu dillərin modelləşdirilməsi ilə əldə olunacaq irəliləyişləri və bunun Afrika üzrə dil texnologiyaları üzərində işləyən bütün cəmiyyətə necə töhfə verəcəyini görmək həqiqətən həyəcanvericidir.”
“African Next Voices” layihəsi digər texnoloji şirkətlərin metodologiyasından köklü şəkildə fərqlilik göstərir. Belə ki, Qərb texnologiya şirkətlərinin etdiyi kimi mövcud rəqəmsal məzmunu əsas götürmək əvəzinə, onlar birbaşa müxtəlif icmalarla işləyirlər.
Keniyadakı Maseno Universitetində dilçilik üzrə fəaliyyət göstərən və layihənin Keniya üzrə komandasına rəhbərlik edən Lilian Vanzare iştirakçılara şəkillər göstərərək onların bu görüntüləri öz ana dillərində təsvir etmələrini xahiş etdi. Burada əsas məqsəd gündəlik və təbii dil istifadəsidir.
Bu layihə təkcə texniki nailiyyət deyil, həm də düşüncə baxımından bir dönüşü ifadə edir. Bir çox texnologiya şirkəti Afrika dillərinə ikinci dərəcəli yanaşarkən, bu təşəbbüs həmin dilləri xüsusi resurs və bilik tələb edən əsas subyektə çevirir.
“Masakhane” adlı Afrika dilləri üzrə süni intellekt və təbii dil emalı sahəsində çalışan qeyri-kommersiya tədqiqat icması Afrika dillərinin afrikalı tədqiqatçılar tərəfindən inkişaf etdirildikdə nələrin mümkün olduğunu açıq şəkildə göstərir. Bu kimi təşəbbüslər süni intellektin gələcəyinin məqsəd yönlü bir şəkildə formalaşa biləcəyini sübut edir və kimin səsinin eşidiləcəyinə Silikon vadisinin qərar verməsini gözləməyə ehtiyac olmadığını göstərir.
Dünyanın Afrikaya əsrlər boyu davam edən laqeydliyi bəlkə qısa bir zamanda bitməyəcək lakin bu kimi təşəbbüslər sayəsində ən azından dəyişikliyin artıq başladığını demək mümkün olar. Və ən əsası bu dəfə bu dəyişikliyin hekayəsini Afrika xalqları özləri yazır.















