Senin, 02 Maret 2015

Pemrosesan Bahasa Alami (PBA)

Nama : Muhamad Hafiz Waliyuddin
NIM    : D03112042
MK      : Pemrosesan Bahasa Alami (PBA)

Pemrosesan Bahasa Alami (PBA)
PBA merupakan cabang ilmu baru dari kecerdasan buatan yang pada dasarnya menitikberatkan kepada interaksi manusia dan komputer. PBA juga dapat diartikan sebagai teknik komputasi dan analisis linguistik dalam tujuannya menganalisa dan merepresentasikan bahasa manusia ke dalam bahasa komputer, tentunya bahasa yang dipahami komputer sehingga ia bisa melakukan apa yang perintahkan sesuai dengan apa yang dipikirkan manusia. Berkembangnya PBA merupakan gabungan dari berbagai cabang keilmuan, yakni Linguistik dengan bahasanya yang formal, Ilmu Komputer dalam kerjanya mengolah data serta efektifitas proses, dan berhubungan dengan psikologi serta peranannya terhadap proses kognitif manusia.
Tujuan dari PBA yang mana merujuk pada sistem berbasis Natural Languade Understanding (NLU). NLU memiliki tujuan utamanya, yakni :
1. Parafrase masukan teks
2. Menerjemahkan teks ke dalam bahasa lain
3. Menjawab pertanyaan yang terkandung dalam teks
4. Menarik kesimpulan dari teks
Dari keempat tujuan tersebut, PBA lebih mengutamakan pada tiga tujuan pertama.
PBA secara garis besar terbagi menjadi dua fokus yang berbeda yakni pemrosesan bahasa dan generasi bahasa. Pemrosesan bahasa mengarah pada analisis bahasa sebagai pendengar dengan maksud untuk mendapat representasi makna, sedangkan disisi lainnya generasi bahasa mengarah terhadap produksi bahasa dari sebuah maksud yang diinginkan.
Beberapa teknologi yang sekarang-sekarang ini lagi populer terdengar yang mengimplementasikan PBA yaitu :

-Simsimi
Adalah apliasi yang lebih menitikberatkan interaksi manusia dan komputer dengan bahasa alami atau bahasa manusia sebagai fungsi utamanya adalah hiburan.
-SIRI dan IRIS
SIRI dan IRIS adalah aplikasi sejenis Simsimi, namu perbedaannya adalah input yang diterima berupa voice atau suara, sehingga diperlukannya speech recognition.

PBA mngenal beberapa tingkatan pemrosesan, yakni :

Selanjutnya juga dijelaskan bidang-bidang ilmu pengetahuan yang sangat berhubungan dengan ilmu Natural Language Processing :
1.Fonetik dan fonologi : Bidang pengetahuan ini berkaitan dengan kata yang dihasilkan oleh suara dapat diketahui. Proses aplikasi yang menggunakan metoda speech based system sangat bergantung pada bidang pengetahuan ini.
2.Morfologi : Pemanfaatan untuk perbedaan satu kata dengan yang lainnya termasuk kedalam bidang pengetahuan ini yang lebih terkait tentang kata dan bentuknya. Antara kata dan elemen lain seperti tanda baca terpisahkan pada tingkatan ini.
3.Sintaksis : Dalam membentuk kalimat dan hubungan antar kata diperlukannya pemahaman tentang urutan kata sehingga proses berubahnya bentuk dari kalimat yang menjadi bentuk yang sistematis. Bidang pengetahuan ini meliputi proses pengaturan tata letak suatu kata dalam kalimat yang akan membentuk kalimat yang dapat dikenali. Dalam bagian-bagian kalimat yang lebih besar sehingga itu dapat dikenali.
4.Semantik : Pemanfaatan tiap kata kedalam bentuk yang lebih mendasar dan juga tidak bergantung pada struktur kalimat maka pemetaan bentuk struktur sintaksis dapat terproseskan. 
5.Pragmatik : Bidang pengetahuan pada level ini sangat erat hubungannya dengan masing-masing konteks yang berbeda, tergantung pada tujuan dibuatnya sistem dan pada situasi apa konteks-konteks tersebut.
6.Discourse Knowledge : Pengenalan terlebih dilakukan pada kondisi apakah suatu kalimat yang telah dibaca dan diketahui pada saat sebelumnya akan sangat berpengaruh terhadap arti dari kalimatnya selanjutnya. Informasi sangat penting untuk dipahami dikarenakan melakukan pengolahan arti terhadap kata ganti orang dan mengartikan aspek sementara dari sebuah informasi yang didapat.
7.World Knowledge : Bidang pengetahuan ini telah mencakup ke dalam sebuah arti kata secara umum dan apakah benar ada arti kata khusus terhadap suatu kata dalam suatu percakapan dengan konteks tertentu.

Pengertian ini bukanlah bersifat tetap, dan kedepannya untuk setiap bentuk bahasa alami yang biasanya ada pendefinisian lagi yang lebih khusus  sesuai dengan karakter bahasa tersebut. Banyaknya permasalahan mungkin hanya mengambil beberapa dari pendekatan tersebut, bahkan kemungkinan ada yang melakukan tambahan proses sesuai dengan karakter yakni bahasa yang telah dipergunakan dan sistem yang terbentuk rapi.
Dari bidang-bidang pengetahuan diatas tadi, masih ada lagi satu masalah yang cukup menguji mental atau sesuatu yang menantang dalam Natural Language yakni ambiguitas atau makna ganda dari suatu kata ataupun kalimat. Arti kata yang berbeda terjadi apabila dari satu masukan yang sama dapat menjadi beberapa arti yang berbeda dan masing-masing dapat bernilai benar. Dari satu masukan yang sama dapat menjadi beberapa arti yang berbeda dan diantara masing-masing tersebut dapat dinilai baik, bergantung terhadap keperluan pengguna. Hal tersebut dapat terjadi disemua tingkatan yang berada diatas.

GRAMATIKA
Merupakan suatu bahasa yang terlihat sebagai suatu aturan yang akan menentukan, apakah suatu kumpulan kata dapat diterima sebagai kalimat oleh bahasa tersebut. Context Free Grammar telah mempunyai sifat mudah dipahami pelakunya dan pengolahannya serta masih dapat diolah kembali dalam bentuk program yang telah terstruktur rapi.  

PARSING
Merupakan suatu proses penganalisaan kumpulan kata dengan memisahkan kata tersebut dan penentuan struktur sintaksis dari setiap kata tersebut. Gramatika yang digunakan juga sangat berhubungan dengan proses parsing apa yang akan diterapkan.

Sumber : 
(makalah mahasiswa ITB)
http://www.scribd.com/doc/142986284/Teknologi-Berbasis-Integrasi-Pemrosesan-Bahasa-Alami-Dan-Visi-Komputer-Dalam-10-Tahun-Kedepan#scribd

http://yuliana.lecturer.pens.ac.id/Kecerdasan%20Buatan/Buku/Bab%205%20Natural%20Language%20Processing.pdf.




Tidak ada komentar:

Posting Komentar