Selasa, 24 Februari 2015

Pemrosesan Bahasa Alami

Bahasa merupakan salah satu bagian yang terpenting dalam kehidupan manusia, bahasa dalam bentuk tulisan merupakan catatan dari pengetahuan ataupun pengalaman dan kisah-kisah hidup yang didapat oleh seseorang dari satu generasi ke generasi lainnya, sedangkan dalam bentuk lisan bahasa merupakan sarana komunikasi antar individu. Tujuan dari Pemrosesan Bahasa Alami (Natural Language Processing) adalah membuat model komputasi dari bahasa alami tersebut, sehingga dapat terjadi interaksi antara manusia dengan komputer. Model komputaasi ini dapat berguna untuk keperluan ilmiah misalnya meneliti sifat-sifat dari suatu bentuk bahasa alami ataupun untuk keperluan sehari-hari agar dapat memudahkan komunikasi antara manusia dengan komputer.
Dalam Pemrosesan Bahasa Alami (Natural Language Processing) harus memperhatikan pengetahuan terhadap bahasa itu sendiri, baik dari kata yang digunakan, penggabungan kata-kata tersebut untuk menghasilkan suatu kalimat yang baik, arti dari sebuah kata, fungsi dari sebuah kata dalam sebuah kalimat dan lain sebagainya. Selain itu kita juga harus mempertimbangkan hal yang sangat berperan dalam bahasa alami, yaitu kemampuan manusia untuk memahami ataupun mengerti bahasa dan kemampuan itu didapat dari pengetahuan oleh manusia itu sendiri. Sebagai contoh dalam sebuah percakapan, seseorang mungkin dapat menjawab pertanyaan ataupun ikut serta dalam percakapan tersebut dengan tidak hanya berdasar pada kemampuan berbahasa tetapi juga harus mengerti istilah-istilah yang umum digunakan dalam percakapan tersebut bahkan harus tahu maksud dari percakapan itu.
Pemrosesan Bahasa Alami (Natural Language Processing) dibagi dalam beberapa bidang pengolahan bahasa, antara lain:
1. Fonetik dan fonologi : merupakan bidang pengetahuan yang berhubungan dengan suara yang menghasilkan kata yang dapat dikenali. Bidang pengolahan ini menjadi penting dalam proses aplikasi yang menggunakan metode speech based system.
2. Morfologi : merupakan pengetahuan yang berhubungan dengan kata dan bentuknya dimanfaatkan untuk membedakan kata. Pada bidang ini dapat dipisahkan antara kata dan tanda baca.
3. Sintaksis : merupakan pemahaman tentang urutan kata dalam pembentukan kalimat dan hubungan antar kata dalam proses perubahan bentuk dari kalimat menjadi bentuk yang sistematis. Bidang ini meliputi proses pengaturan tata letak suatu kata dalam kalimat yang akan membentuk kalimat yang dapat dikenali. Selain itu bidang ini dapat pula mengenali bagian-bagian kalimat dalam suatu kalimat yang lebih panjang.
4. Semantik : merupakan pemetaan bentuk struktur sintaksis dengan menggunakan tiap kata ke dalam bentuk yang lebih mendasar dan tidak tergantung pada struktur kalimat. Bidang ini mempelajari arti kata dari sebuah kalimat yang utuh. Dalam bidang ini belum mencakup konteks dari kalimat tersebut.
5. Pragmatik : bidang ini berkaitan dengan masing-masing konteks yang berbeda tergantung pada situasi dan tujuan dibuatnya sistem.
6. Discourse Knowledge : pada bidang ini dilakukan pengenalan pada suatu kalimat yang sudah dibaca atau dikenali sebelumnya apakah akan mempengaruhi arti dari kalimat berikutnya. Hal ini sangat penting untuk diketahui untuk melakukan pengolahan arti dari pada kata ganti orang untuk mengartikan aspek sementara dari informasi tersebut.
7. World Knowledge : bidang pengetahuan ini mencakup arti dari sebuah kata secara umum, apakah ada arti khusus bagi suatu kata dalam suatu percakapan dengan konteks tertentu.

Definisi mengenai bahasa alami tidaklah kaku, dan untuk setiap bentuk bahasa alami yang ada biasanya ada pendefinisian lagi yang lebih spesifik sesuai dengan karakter bahasa alami tersebut. Pada beberapa masalah mungkin hanya mengambil beberapa dari pendekatan tersebut bahkan mungkin ada yang melakukan tambahan proses sesuai dengan karakter dari bahasa yang digunakan dan sistem yang dibuat.
Selain itu, masih ada lagi satu masalah yang cukup menantang dalam Pemrosesan Bahasa Alami (Natural Language Processing) yaitu ambiguitas atau bermakna ganda dari suatu kata atau suatu kalimat. Dari sebuah masukan yang sama dapat menghasilkan beberapa arti yang berbeda dan masing-masing dapat bernilai benar tergantung pada keperluan pemakainya. Hal ini dapat terjadi pada hampir semua tingkatan pendekatan-pendekatan diatas.

Dalam bidang Pemrosesan Bahasa Alami (Natural Language Processing) dapat dibuat beberapa jenis aplikasi seperti text-based application dan dialogue-based applications.  Dillihat dari namanya kedua aplikasi di atas memiliki perbedaan yang mencolok, pertama kita bahas tentang Text-Based application, aplikasi ini mencakup semua aplikasi yang melakukan proses  terhadap text tertulis seperti misalnya e-mail, buku, berita pada surat kabar, dan sebagainya. Beberapa contoh penggunaan dari Text-Based application ini adalah :
1. Mencari  isi dari e-mail atau surat.
2. Mencari judul tertentu dari sebuah buku atau artikel yang ada pada perpustakaan.
3. Menterjemahkan dokumen dari bahasa satu ke bahasa lainnya.

Perlu kita ketahui bahwa tidak semua system dapat melakukan hal-hal seperti di atas dengan  pendekatan terhadap Natural Language, misal pada contoh mencari judul tertentu dari sebuah buku atau artikel yang ada pada perpustakaan dapat didekatai dengan system database yang lumayan lengkap.  
Berikutnya kita akan bahas  bentuk dialogue-based application. Dilihat dari namanya sudah jelas ini melibatkan bahasa lisan atau pengenalan suara,  tetapi tidak mutlak hanya itu. Bidang ini juga melakukan interaksi dengan cara memasukan teks pertanyaan melalui keyboard. Aplikasi yang sering dipakai  dalam bidang ini sebagai berikut :
1. Sistem pelayanan otomatis pada telepon
2. Control suara pada peralatan elektronik
3. Sistem tanya jawab, yang mana bahasa alami digunakan untuk mendapatkan informasi dari suatu database.
Perlu diketahui bahwa batasan untuk sistem yang dapat melakukan interaksi melalui bahasa lisan ada pada bagian speech recognition yang merupakan bagian terpisah dari Natural Language.

Diposting Oleh :
D03112068  Prayudi Aditya Nugraha
D03112069  Eggi Chandra

Tidak ada komentar:

Posting Komentar