Bisnis.com, BANDUNG - GIZ Indonesia menggandeng Kementerian PPN/Bappenas meluncurkan tiga data bahasa daerah di Indonesia guna mendukung pengembangan teknologi yang berkelanjutan.
Tiga bahasa daerah penting dipilih untuk pembangunan data: Minangkabau, Bali, dan Bugis. Bahasa Bali mewakili wilayah Bali-Sasak-Sumbawa, sementara Minangkabau melambangkan wilayah Malayo-Chamic di Sumatera, dan Bahasa Bugis mewakili Sulawesi Selatan.
Koordinator Ekosistem dan Pemanfaatan TIK, Direktorat Ketenagalistrikan, Telekomunikasi, dan Informatika Bappenas Andianto Haryoko mengatakan bahwa kegiatan ini merupakan salah satu upaya untuk melestarikan beragam bahasa daerah di Indonesia dengan pengembangan teknologi digital.
"Sebagai negara kedua yang memiliki bahasa daerah terbanyak di dunia yakni 718 bahasa daerah, tentu kita harus terus berupaya agar penggunaan bahasa daerah dari masa ke masa terus dilakukan dan dilestarikan seiring perkembangan teknologi yang makin modern," ujarnya saat konferensi pers di Gedung PTS ITB, Kota Bandung, Senin (22/4/2024).
Sementara itu, Co-Founder of Prosa.AI Ayu Purwarianti memaparkan ketiga bahasa (Bugis, Bali, dan Minangkabau) dipilih atas dasar popularitas penggunaan serta representasi geografis yang luas di Indonesia.
"Sebelumnya Kami telah merilis dua bahasa yakni bahasa Sunda dan Jawa, Sekarang kami meluncurkan tiga bahasa Bugis, Bali, dan Minangkabau yang memiliki popularitas belum banyak di internet dan tingkat penggunaan bahasa yang rendah, ditambah tiga bahasa tersebut mewakili daerah Barat, Tengah, dan Timur," papar Ayu.
Baca Juga
Meskipun menghadapi tantangan seperti kesibukan dan kondisi eksternal seperti pemadaman listrik, proyek ini berhasil melalui berbagai hambatan dan FAIR Forward berhasil mencapai target pembangunan data sebesar 10 juta kata dalam kurun waktu 48 pekan.
Proses ini melibatkan anotator remote dari masyarakat setempat dengan beragam latar belakang dialek dan jenis pekerjaan memastikan representasi yang seimbang dari berbagai gender. Kemudian data yang terkumpul dianalisis serta dipublikasikan pada platform HuggingFace yang memudahkan akses untuk para pengembang dan masyarakat umum dalam memperoleh bahasanya.
Melalui kegiatan ini, Ayu berharap masyarakat dan inovator AI lokal dapat memanfaatkan data bahasa daerah yang tersedia untuk membangun teknologi yang mendukung kebutuhan terkait bahasa daerah.
"Dengan adanya kegiatan ini diharapkan dapat menjadi ruang pembelajaran bagi para inovator AI dan masyarakat umum dalam mengetahui beragam bahasa daerah yang ada di Indonesia. Dan kedepannya pemerintah Indonesia dapat terus mendukung program ini," harapnya.