Pemrosesan Bahasa Alami
PBA (Pemrograman Bahasa Alami) atau NLP (Natural Language Processing) merupakan salah satu cabang dari ilmu komputer dan linguistik atau ilmu tentang bahasa (manusia) yang berhubungan dengan interaksi antara seperangkat alat komputer dan bahasa alami (manusia). Pemrograman Bahasa Alami juga sering dikatakan bagian dari kecerdasan buatan dan bidang kajian atau bahasan yang berkaitan dengan linguistik komputer.
Tujuan dalam bidang ini adalah melakukan pemrosesan model komputasi dari bahasa, sehingga akan terjadi suatu hubungan atau interaksi antara manusia dengan komputer dengan perantara bahasa alami. Model ini berguna untuk keperluan ilmiah maupun untuk keperluan sehari-hari yaitu memudahkan komunikasi antara manusia itu sendiri dan komputer.
Tingkat Pemrograman Bahasa Alami (Natural Language Processing) memiliki hubungan dengan bidang-bidang pengetahuan yang digunakan yaitu sebagai berikut :
1. Fonetik dan Fonogi : bidang yang berhubungan dengan voice (suara) yang dapat menghasilkan kata-kata yang dapat dikenali. Bidang ini bisa menjadi penting dalam suatu proses suatu aplikasi yang menggunakan metode speech based system.
2. Morfologi : bidang yang berkaitan pengetahuan tentang kata dan bentuknya digunakan untuk membedakan satu kata dengan kata lainnya. Pada bidang ini atau tingkat ini juga dapat dipisahkan antara kata atau kalimat dan bentuk lain, tanda baca dsb.
3. Sintaksis : bidang yang membahas tentang pemahaman tentang urutan kata dalam pembentukan kalimat dan interaksi antar kata tersebut dalam proses perubhana bentuk dari kalimat itu sendiri menjdi bentuk yang lebih sistematis. Meliputi proses pengaturan atau pengolahan tata letak kata dalam kalimat akan membentuk kalimat yang dapat dikenali dan dapat pula dikenali bagian-bagian kalimat dalam suatu kalimat yang lebih besar lagi.
4. Semantik : bidang yang mengolah pemetaan bentuk susunan sintaksis dengan memanfaatkan tiap kata ke dalam bentuk yang lebih mendasar dan mandiri dari susunan kalimat. Semantik mempelajari arti suatu dan bagaimana arti kata tersebut membentuk suatu arti dari kalimat yang utuh.
5. Pragmatik : bidang pengtahuan yang ada disini berkaitan dengan konteks yang tidak sama tergantung pada situasi dan tujuan dari pemrosesan sistem.
6. Discourse Knowledge : bidang tentang pengenalan suatu kalimat itu sudah dibaca dan dikenali sebelumnya akan mempengaruhi arti dari kalimat selanjutnya. Informasi ini tergolong penting untuk proses pengolahan arti terhadap kata ganti orang dan mengartikan aspek sementara dari informasi.
7. World Knowledge : bidang yang meliputi arti sebuah kata secara umum dan apakah arti khusus atau spesifik bagi suatu kata dalam suatu perbincangan dengan konteks tertentu.
Definisi-definisi tersebut bersifat fleksibel atau tidak baku, dan untuk bentuk bahasa alami yang sudah ada biasanya ada pendefinisian lagi yang lebih khuus sesuai karakter bahasa tersebut. Selanjutnya, masih ada satu masalah dalam Pemrograman Bahasa Alami yaitu ambiguitas atau makna lain dari suatu kata atau kalimat itu sendiri.
Jenis-jenis aplikasi yang digunakan atau dibuat pada bidang-bidang ini, adalah :
Text – Based Application dan Dialogue – Based Applications
Text – Based Application mencakup segala macam aplikasi-aplikasi yang melakukan proses atau pengolahan terhadap teks tertulis misalnya buku, surat kabar, email dan sebagainya. Sedangkan Dialogue – Based Applications melibatkan bahasa lisan atau pengenalan voice (suara), akan tetapi bidang ini juga memasukkan hubungan atau interaksi dengan cara memasukkan teks pertanyaan melalui keyboard. Salah satu aplikasi yang digunakan adalah : Sistem tanya jawab, pemrograman bahasa alami digunakan mendapatkan informasi dari suatu database. Tetapi, sebelumnya harus diberikan batasan bahwa untuk sistem yang dapat melakukan hubungan melalui bahasa lisan ada bagian speech recognition yang merupakan bagian terpisah dari bahasa alami.
Gramatika
Grammar dari Chomsky Hierarchy yaitu Context Free Grammar mempunyai sifat-sifat lebih mudah dimengerti perilakunya dan pengolahan serta masih dapat diolah dalam bentuk program yang tersusun. Sebuah bahasa L disebut symbol yaitu string yang dbentuk dari bagian terkecil bisa dijelaskan sebagai set dari string. Suatu kelompok v dari symbol biasa dikenal sebagai perbendaraan kata. Grammar adalah sebuah kata atau kalimat yang dapat dikenali dengan berdasarkan atuan-aturan yang sudah ada. Grammar dapat dibentuk dari 4 tuple yaitu : simbol non-terminal, simbol terminal, simbol pertama atau awal dan rules penulisan. Tetapi, betul dalam grammar bukan berarti pasti benar, bisa saja benar secara struktural tapi bukan berarti selalu benar dalam arti.
Parsing
Parsing merupakan suatu proses atau pengolahan menganalisa suatu kumpulan kata dengan memisahkan kata tersebut dan menentukan susunan atau struktur sintaksis dari tiap kata tersebut. Proses parsing dapat dibagi menjadi dua bagian besar yaitu Bottom Up Parsing dan Top Down Parsing dalam mengenali struktur suatu kalimat. Mencari dari simbol-simbol terminal menuju ke arah pembentukan simbol awal s yang disebut Bottom Up Parser dan Bottom Up Parsing sebaliknya.
Semantik
Semantik memiliki kumpulan aturan-aturan dalam basis pengetahuan untuk menginterprestasikan sebuah kalimat.
Aturan 1 : IF derminer merupakan bagian awal dalam kalimat dan diikuti oleh noun THEN noun tersebut dianggap sebagai subyek.
Aturan 2 : IF verb menjelaskan tentang apa yang dikerjakan oleh subyek yang diikuti subyek THEN.
Aturan 3 : IF noun dianggap sebagai obyek dikarenakan diikuti subyek dan verb THEN.
Aturan 4 : IF kalimat mempunyai bentuk subyek, ver, obyek THEN subyek mengerjakan (verb) yang ada hubungannya dengan obyek.
Kalimat yang diinginkan akan ditrigger aturan 1 yang mengindentifikasikan plane sebagai subyek, kemudian aturan 2 menjelaskan bahwa plan flew. Selanjutkan aturan 3 dan 4 mengindentifkasikan home sebagai subyek. Jadi, semantik adalah proses yang rumit dikarenakan hal ini tergantung pada maksud atau makna dalam kalimat dan juga adanya kemungkinan arti lain dalam kalimat. Pendekatan yang digunakan merupakan pendekatan Semantic Grammar yang dipadukan dengan Dictionary tambahan dan Template Grammar. Semantic Grammar dipilih sebagai grammar utama dikarenakan didalam grammar sudah terkandung unsur semantic yang dapat digunakan dalam pembentukan semantic dari kalimat dan format dari kalimat sudah dibatasi pada bentuk tertentu jadi dapat diandalkan untuk bentuk-bentuk tanya dan perintah.
REFERENSI :
Refensi dari internet :
• http: //id.wikipedia.org/wiki/Pemrosesan_bahasa_alami
• refensi dari internet berupa pdf yang berjudul “Bab 5 Natural Language Processing”
Tidak ada komentar:
Posting Komentar