Pemrosesan Bahasa Alami
Bahasa Pemrosesan Alami atau Natural Language processing
adalah salah satu bidang ilmu komputer maupun
kecerdasan buatan yang berhungan dengan interaksi komputer dengan bahasa
alami manusia, misalnya seperti bahasa inggris, indonesia, china dan sebagainya.
Adapun interaksi tersebut dapat berupa suara maupun tulisan.
Adapun tujuan utama dibuatnya BPA adalah untuk membuat
mesin-mesin yang mengerti bahasa atau perintah manusia sehingga nantinya
diharapkan dapt memberikan respon yang sesuai dengan kebutuhan manusia. BPA
sendiri mulai muncul pada tahun 1950-an, meskipun pada tahun-tahun sebelumnya
sudah ada penelitan yang mirip.
Alan Touring atau sering dikenal sebagai bapak Ilmu
Komputer, melalui artikelnya yang berjudul “ Computing Machinery and Intelligence”,
mengusulkan adanya “Touring Test”.Yaitu
sebuah tes yang bertujuan untuk mengukur kemampuan komputer dalam berperilaku
cerdas atau sesuai dengan pemikiran manusia. Konsepnya, Seorang penilai (Juri)
yang merupakan manusia akan melakukan penilaian terhadap percakapan antara
manusia dan komputer yang dipisahkan satu sama lain. Jika Juri kesulitan untuk
membedakan antara manusi dan komputer maka dapat dikatakan bahwa komputer
tersebut telah lulus tes.
Bahasa Pemrosesan Alami sendiri muncul setelah munculnya
pemikiran dari seorang tokoh bernama Chomsky. Ia mempresentasikan bahasa
sebagai rangkaian simbol, kemudian ia berhasil membuktikan bahwa bahasa apapun
dapat di represntasikan dengan sebuah cara yang universal. Menurutnya, dengan
menggunakan simbol-simbol dan aturan untuk mengatur susunan simbol-simbol ini
akan membuka peluang untk melakukanproses bahasa secara simbolik dengan
teknologi komputer.
Sistem
pemrosesan bahasa alami secara lisan terbagi menjadi tiga, yaitu:
- Sub-system Natural Language Prosessing (NLP), dimana fungsinya adalah untuk melakukan pemrosesan secara simbolik terhadap bahasa tulisan. Contoh bentuk aplikasinya adalah sistem translator dan sistem pemeriksaan sintaks bahasa.
- Sub-System Text to Speech (TTS), berguna untuk mengubah textmenjadi suara/ucapan.
- Sub-System Speech Recognation (SR), fungsinya adalah untuk mengubah atau mengenali suara/ ucapan menjadi text.
Pada
Pemrosesan Bahasa Alami (PBA), teknik-teknik yang digunakan bersifat sangat
‘Language Independent’, maksudnya adalah teknik yang berlaku pada sistem
tersebut tidak mudah untuk diterapkan di sistem lain,dimana umumnya bersifat
generik.
- System Speech Recognation
Pada System Speech Recognation ( Sistem Pengenalan Ucapan),
inputnya berupa ucapan manusia, setelah diproses dan diidentifikasi oleh sistem
maka akan mendapatkan outpunt berupa text yang sesuai dengan kata yang
diucapkan.
Penganalis inputan akan mentransformasikan sinyal ucapan
dari domain waktu ke domain frekuensi. Setiap sinyal akan mempunyai ciri yang
unik. Setiap fonem (pengucapan suatu unit bunyi ucapan) kebanyakan akan berbeda
antara orang yang satu dengan yang lainnya, tergantung pada fonem-fonem
disekitarnya, situasi emosi, noise (kebisingan), dan faktor-faktor lainnya.
Sistem akan mengidentifikasi ucapan/suara kemudian fonem itu akan dicari kombinasinya, sehingga hasil ucapannya dapat
diterima/ sesuai dengan apa yang diucapkan oleh manusia tersebut.
Pada umumnya Speech Recognation dioperasikan dengan dua
mode, yakni mode belajar dan mode produksi. Mode belajar akan melatih sistem
menggunaan beberapa kata ata kalimat dengan kriteria tertentu. Setiap kata atau
kalimat akan menghasilkan pola-pola tertentu
untuk dipelajari oleh sistem dan disimpan sebagai sebuah referensi. Sedangkan
mode produksi (pengenalan ucapan), masing-masing kalimat yang akan
diidentifikasi akan di analisis polanya, setelah itu, hasil perbandingan
referensi, modul klasifikasi pola, dan pengambilan keputusannya akan
mengidentifikasi kata atau kalimat yang
diucapkan.
Kemampuan sistem untuk mengenali ucapan sangat bergantung
pada referensi yang dihasilkannya melalui proses belajar dalamsistem tersebut.
Namun, kemampuan ini dapat dilatih menggunakan korpus (rekaman suara yang
heterogen dalam volume yang sangat besar serta memenuhi kriteria teknis).
- System Text to Speech
Sistem ini mempunyai proses yang berkebalikan dengan Sistem Pengenalan Ucapan, namun pendekatannya sangatlah berbeda. Pada Umumnya sistem ini terdiri dari dua bagian sebagai berikut:
- Bagian Konverter Text ke Fonem, yang berfungsi untuk mengubah inputan text menjadi kode-kode suara yang direpresentasikan dengan kode-kode fonem, durasi, serta pitch-nya
- Bagian Konverter Fonem ke Ucapan, berfungsi untuk menerima masukan kode-kode dari proses sebelumnya kemudian mengubahnya menjadi bunyi atau ucapan sesuai dengan inputan textnya.
- System Natural Language Prosessing
Bahasa Pemrograman Alami tumbuh secara alami guna memenuhi
kebutuhan manusia, sehingga akan sulit diproses dibandingkan dengan bahasa
buatan karena bahasa alami tidak
dirancang dengan memperhatikan kendala-kendala untuk kemudahan proses. Hingga
kini, masalah-masalah mendasar mengenai bahasa pemrosesan aami masih belum
terselesaikan.
Berikut adalah beberapa alasan yang menyulitkan pemrosesan
bahasa alami:
- Sering terjadi ambigu (makna ganda)
- Kosa kata dalam bahasa alami sangat banyak karena selalu berkembang seiring dengan berjalannya waktu
Ada
banyak contoh aplikasi yang dikembangkan mengunakan teknologi bahasa,
iantaranya:
- Alat bantu membaca untuk tunanetra, inputannya berupa text tercetak dan outputnya berupa ucapan dari text yang diinputkan
- Alat bantu bicara untuk tunawicara, inputannya berupa posisi tangan yang diditeksi oleh sensor dan unit identifikasi, kemudian rangkaian huruf yang teridentifikasi akan disusun membentuk kata-kata kemudian akan dihasilkan suara.
Oleh :
- Rini Apriyani (D03112033)
- Suti Kurnia Dewi (D03112063)
Referensi
: Orasi Ilmiah Dr. Arry Akhmad Arman (Departemen Teknik Elektro, Fakultas
Teknologi Industri – ITB), pada acara
Sidang Terbuka Institut Teknologi Bandung dengan acara Peresmian Penerimaan
Mahasiswa Baru ITB 2004, 23 Agustus 2004
Tidak ada komentar:
Posting Komentar