Natural language processing (NLP) atau dalam bahasa Indonesia berarti Pemrosesan Bahasa Alami (PBA) merupakan cabang dari ilmu komputer dan linguistik yang membahas tentang interaksi antara bahasa manusia (bahasa alami) dan komputer. NLP juga sering disebut sebagai cabang dari kecerdasan buatan (Artificial Inteligence) dan memiliki kajian yang berhubungan dengan linguistik komputasional.
Bahasa dapat dibedakan menjadi 2 yaitu Bahasa Alami dan Bahasa Buatan. Bahasa Alami adalah bahasa yang digunakan manusia untuk berkomunikasi, misalnya Bahasa daerah, bahasa inggris, jepang dan sebagainya. Sedangkan Bahasa buatan merupakan bahasa yang sengaja dibuat secara khusus untuk kebutuhan tertentu, seperti bahasa-bahasa pemrograman komputer atau bahasa pemodelan.
Sedikit melihat sejarahnya, NLP dimulai pada tahun 1950-an. Bapak ilmu komputer “Alan Turing” menerbitkan sebuah artikel. Didalam artikel terkenalnya ini Alan Turing mengusulkan sebuah tes yang sekarang dikenal Turing Test. Sebuah tes yang akan mengukur kemampuan mesin (program komputer) untuk menunjukan kecerdasannya. Ilustrasinya seorang juri (manusia) akan melakukan percakapan dengan manusia dan mesin yang dites tersebut. Peserta akan dipisahkan satu sama lain. Mesin tersebut akan dinyatakan lulus tes jika juri tidak bia membedakan antara manusia dan mesin.
Tujuan dari bidang Bahasa Alami ini adalah untuk melakukan proses pembuatan model komputasi dari bahasa manusia, sehingga antara manusia dan komputer dapat melakukan interaksi dengan perantaranya bahasa alami. Sebuah Sistem Bahasa Alami harus memperhatikan pengetahuan dari bahasa itu sendiri baik dari segi kata yang digunakan, apa arti dari sebuah kata, fungsi kata dari sebuah kalimat dan bagaimana dari kata-kata tersebut dapat membentuk sebuah kalimat.
Bahasa alami pada prinsipnya merupakan bentuk dari representasi suatu pesan yang ingin dikomunikasikan oleh antar manusia, bisa berupa suara atau ucapan tetapi juga bisa dalam bentuk tulisan. Intinya adalah dalam pemrosesan bahasa alami, penguraian dari parser atau yang lebih dikenal dengan kalimat. Parser itu sendiri berfungsi untuk membaca kalimat dengan kata demi kata serta menentukan jenis kata apa yang dapat mengikuti kata tersebut.
NLP memiliki beberapa kajian antara lain mencakup, segmentasi teks, segmentasi tuturan, penandaan kelas kata, dan pengawataksaan makna.
Ada 2 bagian utama dari pengolahan bahasa alami, yaitu : parser, sistem representasi pengetahuan dan pengolahan output. Penjelasaannya sebagai berikut :
1. Parser : merupakan suatu sistem yang mengambil kalimat input bahasa alami dan menguraikannya kedalam bagian gramatikal (kata kerja, kata benda, kata sifat dan sebagainya).
2. Sistem representasi pengetahuan dan pengolahan output : Sistem representasi pengetahuan merupakan sistem yang menganalisis output parser sehingga dapat menentukan maknanya.
• Pengolahan Natural Language Processing
Natural Language Processing memiliki beberapa tingkatan pengolahan yaitu :
1. Fonetik dan Fonologi : berhubungan dengan hasil kata yang dikenali melalui suara yang diinputkan. Sangat penting untuk aplikasi yang memakai metoda speech bases system.
2. Morfologi : manfaatnya untuk membedakan antara kata yang satu dan kata yang lainnya. Antara kata, tanda baca atau lainnya akan dipisahkan.
3. Sintaksis : pengetahuan tentang pemahaman urutan kata untuk membentuk kalimat dan proses perubahan hubungan antar kata yang membentuk kalimat menjadi bentuk yang terstruktur (sistematis).
4. Semantik : tidak bergantung pada struktur kalimat, bentuk struktur sintaksis akan dipetakan berdasarkan tiap kata ke dalam bentuk yang lebih mendasar. Pada tingkatan ini akan mempelajari arti suatu kata dan bagaimana arti dari setiap kata tersebut membentuk suatu arti dalam suatu kalimat yang utuh.
5. Pragmatik : pada tingkat ini, konteksnya akan berbeda-beda tergantung dari sistem yang dibuat.
6. Discource Knowledge : pengetahuan tentang pengenalan apakah kalimat yang sudah diinputkan akan terbaca dan dikenali serta apakah arti dari sebelumnya akan mempengaruhi arti kalimat yang selanjutnya.
7. World Knowledge : pada tahap ini apakah dalam suatu kalimat tersebut ada arti khusus bagi suatu kata. World knowledge mencakup arti kata secara umum.
Tingkatan pengolahan bahasa alami ini definisinya tidak bersifat kaku. Bisa lebih spesifik dengan menambahkan tambahan proses sesuai dengan karakter dari bahasa yang digunakan dan sistem yang dibentuk atau pada beberapa masalah mungkin akan mengambil beberapa pendekatannya saja.
Makna ganda dari suatu kata atau suatu kalimat, atau biasa disebut Ambiguitas, juga merupakan kendala dalam NLP, misalnya bisa saja akan memiliki arti yang berbeda dengan nilai yang sama benar dari masukan yang sama, hal ini tergantung dari keperluan yang memakai.
• Aplikasi Natural Language
Dalam bidang Natural Language pada umumnya ada 2 jenis aplikasi yang bisa dibuat yaitu :
1. Text – based application : mencakup segala macam aplikasi yang melakukan proses dengan text tertulis misalnya berupa e-mail, berita di surat kabar, buku dan sebagainya. Sebagai contoh : mencari judul buku pada perpustakaan. Dengan menggunakan Text – based application pencarian akan lebih efisien dari sistem database.
Dialogue – based applications : berhubungan dengan pengenalan suara atau bisa juga dengan cara memasukkan text melalui keyboard. Contoh penerapaannya pada sistem tanya jawab, dimana bahasa alami digunakan dalam mendapatkan informasi dalam database. Selain itu penerapannya juga bisa pada kontrol suara peralatan elektronik.
Referensi :
http://id.wikipedia.org/wiki/Pemrosesan_bahasa_alami
https://ariefrahmansyah.wordpress.com/tag/pemrosesan-bahasa-alami/
http://yuliana.lecturer.pens.ac.id/Kecerdasan Buatan/Buku/Bab5 Natural Language Processing.pdf
Nama : Anisa D03112030 & Annisa D03112066