Sistem etiketimi standard morfologjik dhe sintaksor për gjuhën shqipe |
Përdorimi i Metodave të Inteligjencës Artificiale në Përpunimin e Teksteve në Gjuhën Shqipe
Agjencitë ekzekutuese: Fakulteti i Teknologjisë së Informacionit, Universiteti Politeknik i Tiranës dhe Departamenti i Gjuhësisë, Fakulteti i Historisë dhe i Filologjisë, Universiteti i Tiranës
Agjencia financuese: Agjencia e Kombëtare e Kërkimit Shkencor dhe Inovacionit (AKKSHI)
Programi: Programet Kombëtare të Kërkimit dhe Zhvillimit/Programi Kombëtar "Sistemet dhe Teknologjitë e Informacionit (STI)"
Drejtues i projektit: Dr. Nelda Kote
Personeli i përfshirë në projekt:
Prof. Elinda Meçe FTI/UPT
Dr. EvisTrandafili FTI/UPT
M.Sc. AlbaHaveriku FTI/UPT
Dr. Elsa Skënderi Rakipllari FHF/UT
Prof. Asoc. Anila Çepani Sema FHF/UT
Prof. Asoc. Lindita Xhanari FHF/UT
Prof. Asoc. RozanaRushiti FHF/UT
Prof. Asoc. Albana Ndoja FHF/UT
Projekti ka si qëllim të krijojë një sistem etiketimi standard morfologjik, sintaksor, për temëzimin, emërtimin e entiteteve dhe të tipave të fjalive për gjuhën shqipe duke u bazuar në modele të gjuhëve ndërkombëtare si anglishtja por në përputhje me rregullat e gjuhës shqipe. Synim tepër i rëndësishëm i këtij projekti është krijimi me kritere shkencore i një korpusi në gjuhën shqipe, të etiketuar në nivel morfologjik, sintaksor, semantik, etj. duke u bazuar sistemin e etiketimit standard të realizuar po në kuadër të këtij projekti. Është e domosdoshme që të ngrihet infrastruktura e nevojshme softuerike për krijimin, ruajtjen dhe menaxhimin e korpusit të etiketuar, si dhe trajnimin e një etiketuesi, i cili bën etiketimin e vazhdueshëm automatik të teksteve në gjuhën shqipe dhe ky është qëllimi i tretë i projektit.
-
Propozimi i një standardi etiketimi për gjuhën shqipe duke u bazuar në rregullat e gjuhës shqipe standarde.
-
Organizimi i një workshop-i me palët e interesit, gjuhëtarë dhe studiues të TIK-ut dhe jo vetëm, që punojnë në fushën e PGJN-së. Prezantimi dhe diskutimi i standardit të etiketimit për gjuhën shqipe.
-
Zbatimi i aplikacioneve softuerike të cilat ndihmojnë në etiketimin e korpusit dhe i bazës së të dhënave për korpusin e etiketuar në gjuhën shqipe.
-
Mbledhja dhe përzgjedhja me kritere të përcaktuara qartë i teksteve për korpusin në gjuhën shqipe, i cili do të etiketohet mbi bazën e standardit të propozuar për etiketimin. Përzgjedhja e korpusit luan një rol shumë të rëndësishëm në sistemet e etiketimit automatik. Ky korpus duhet të jetë sa më gjithëpërfshirës në fusha dhe me fjali sa më afër gjuhës së sotme.
-
Etiketimi manual i korpusit të përzgjedhur nga gjuhëtarët në mbështetje me ekspertët e TIK-ut.
-
Zbatimi, trajnimi dhe testimi i etiketuesit për tekste në gjuhën shqipe me cilësi e saktësi të lartë etiketimi. Përzgjedhja e teknologjive më të mira për të zbatuar këtë etiketues.
-
Publikimi i së paku dy artikujve në konferenca apo revista shkencore brenda ose jashtë vendit;
-
Publikimi i sistemit të etiketimit dhe të korpusit të etiketuar në mediat online me qasje të hapur;
-
Promovimi i rëndësisë dhe diseminimi i rezultateve të arritura të projektit në faqet dhe kanalet zyrtare të IAL-ve përkatëse dhe në mediat audio-vizive kombëtare.
Fakulteti i Teknologjisë së Informacionit
Universiteti Politeknik i Tiranës
Sheshi Nënë Tereza 4, Tiranë
|