Rabu, 25 Februari 2015

Pemrosesan Bahasa Alami

Pemrosesan Bahasa Alami
Bahasa Pemrosesan Alami atau Natural Language processing adalah salah satu bidang ilmu komputer maupun  kecerdasan buatan yang berhungan dengan interaksi komputer dengan bahasa alami manusia, misalnya seperti bahasa inggris, indonesia, china dan sebagainya. Adapun interaksi tersebut dapat berupa suara maupun tulisan.
Adapun tujuan utama dibuatnya BPA adalah untuk membuat mesin-mesin yang mengerti bahasa atau perintah manusia sehingga nantinya diharapkan dapt memberikan respon yang sesuai dengan kebutuhan manusia. BPA sendiri mulai muncul pada tahun 1950-an, meskipun pada tahun-tahun sebelumnya sudah ada penelitan yang mirip.
Alan Touring atau sering dikenal sebagai bapak Ilmu Komputer, melalui artikelnya yang berjudul “ Computing Machinery and Intelligence”, mengusulkan adanya  “Touring Test”.Yaitu sebuah tes yang bertujuan untuk mengukur kemampuan komputer dalam berperilaku cerdas atau sesuai dengan pemikiran manusia. Konsepnya, Seorang penilai (Juri) yang merupakan manusia akan melakukan penilaian terhadap percakapan antara manusia dan komputer yang dipisahkan satu sama lain. Jika Juri kesulitan untuk membedakan antara manusi dan komputer maka dapat dikatakan bahwa komputer tersebut telah lulus tes.
Bahasa Pemrosesan Alami sendiri muncul setelah munculnya pemikiran dari seorang tokoh bernama Chomsky. Ia mempresentasikan bahasa sebagai rangkaian simbol, kemudian ia berhasil membuktikan bahwa bahasa apapun dapat di represntasikan dengan sebuah cara yang universal. Menurutnya, dengan menggunakan simbol-simbol dan aturan untuk mengatur susunan simbol-simbol ini akan membuka peluang untk melakukanproses bahasa secara simbolik dengan teknologi komputer.
Sistem pemrosesan bahasa alami secara lisan terbagi menjadi tiga, yaitu:

  1. Sub-system Natural Language Prosessing (NLP), dimana fungsinya adalah untuk melakukan pemrosesan secara simbolik terhadap bahasa tulisan. Contoh bentuk aplikasinya adalah sistem translator dan sistem pemeriksaan sintaks bahasa.
  2. Sub-System Text to Speech (TTS), berguna untuk mengubah textmenjadi suara/ucapan.
  3. Sub-System Speech Recognation (SR), fungsinya adalah untuk mengubah atau mengenali suara/ ucapan menjadi text.
Pada Pemrosesan Bahasa Alami (PBA), teknik-teknik yang digunakan bersifat sangat ‘Language Independent’, maksudnya adalah teknik yang berlaku pada sistem tersebut tidak mudah untuk diterapkan di sistem lain,dimana umumnya bersifat generik. 

    • System Speech Recognation

Pada System Speech Recognation ( Sistem Pengenalan Ucapan), inputnya berupa ucapan manusia, setelah diproses dan diidentifikasi oleh sistem maka akan mendapatkan outpunt berupa text yang sesuai dengan kata yang diucapkan.
Penganalis inputan akan mentransformasikan sinyal ucapan dari domain waktu ke domain frekuensi. Setiap sinyal akan mempunyai ciri yang unik. Setiap fonem (pengucapan suatu unit bunyi ucapan) kebanyakan akan berbeda antara orang yang satu dengan yang lainnya, tergantung pada fonem-fonem disekitarnya, situasi emosi, noise (kebisingan), dan faktor-faktor lainnya. Sistem akan mengidentifikasi ucapan/suara kemudian fonem itu akan dicari  kombinasinya, sehingga hasil ucapannya dapat diterima/ sesuai dengan apa yang diucapkan oleh manusia tersebut.
Pada umumnya Speech Recognation dioperasikan dengan dua mode, yakni mode belajar dan mode produksi. Mode belajar akan melatih sistem menggunaan beberapa kata ata kalimat dengan kriteria tertentu. Setiap kata atau kalimat akan menghasilkan pola-pola tertentu  untuk dipelajari oleh sistem dan disimpan sebagai sebuah referensi. Sedangkan mode produksi (pengenalan ucapan), masing-masing kalimat yang akan diidentifikasi akan di analisis polanya, setelah itu, hasil perbandingan referensi, modul klasifikasi pola, dan pengambilan keputusannya akan mengidentifikasi kata atau kalimat  yang diucapkan.
Kemampuan sistem untuk mengenali ucapan sangat bergantung pada referensi yang dihasilkannya melalui proses belajar dalamsistem tersebut. Namun, kemampuan ini dapat dilatih menggunakan korpus (rekaman suara yang heterogen dalam volume yang sangat besar serta memenuhi kriteria teknis).

    • System Text to Speech

Sistem ini mempunyai proses yang berkebalikan dengan Sistem Pengenalan Ucapan, namun pendekatannya sangatlah berbeda. Pada Umumnya sistem ini terdiri dari dua bagian sebagai berikut:

  1. Bagian Konverter Text ke Fonem, yang berfungsi untuk mengubah inputan text menjadi kode-kode suara yang direpresentasikan  dengan kode-kode fonem, durasi, serta pitch-nya
  2. Bagian Konverter Fonem ke Ucapan, berfungsi untuk menerima masukan kode-kode dari proses sebelumnya kemudian mengubahnya menjadi bunyi atau ucapan sesuai dengan inputan textnya.

    •  System Natural Language Prosessing
Bahasa Pemrograman Alami tumbuh secara alami guna memenuhi kebutuhan manusia, sehingga akan sulit diproses dibandingkan dengan bahasa buatan  karena bahasa alami tidak dirancang dengan memperhatikan kendala-kendala untuk kemudahan proses. Hingga kini, masalah-masalah mendasar mengenai bahasa pemrosesan aami masih belum terselesaikan.
Berikut adalah beberapa alasan yang menyulitkan pemrosesan bahasa alami:

  1. Sering terjadi ambigu (makna ganda)
  2.  Kosa kata dalam bahasa alami sangat banyak karena selalu berkembang seiring dengan berjalannya waktu
Ada banyak contoh aplikasi yang dikembangkan mengunakan teknologi bahasa, iantaranya:

  1. Alat bantu membaca untuk tunanetra, inputannya berupa text tercetak dan outputnya berupa ucapan dari text yang diinputkan
  2.  Alat bantu bicara untuk tunawicara, inputannya berupa posisi tangan yang diditeksi oleh sensor dan unit identifikasi, kemudian rangkaian huruf yang teridentifikasi akan disusun membentuk kata-kata kemudian akan dihasilkan suara.
Oleh :
  1. Rini Apriyani  (D03112033)
  2. Suti Kurnia Dewi (D03112063)


Referensi : Orasi Ilmiah Dr. Arry Akhmad Arman (Departemen Teknik Elektro, Fakultas Teknologi  Industri – ITB), pada acara Sidang Terbuka Institut Teknologi Bandung dengan acara Peresmian Penerimaan Mahasiswa Baru ITB 2004, 23 Agustus 2004

Tidak ada komentar:

Posting Komentar