Pemrosesan
Bahasa Alami
oleh
: Amiriyanti & Duwi Juliyatin
Pemrosesan Bahasa Alami merupakan salah satu bidang ilmu komputer,
kecerdasan buatan dan bahasa yang berkaitan dengan interaksi antara
komputer dan bahasa alami manusia yang secara umum digunakan oleh
manusia dalam berkomunikasi satu sama lain. Tujuan utama dari belajar
pemrosesan bahasa alami adalah membuat mesin yang mampu berinteraksi
dengan bahasa alami manusia baik berupa suara/ucapan (spoken
language) atau berupa tulisan seperti bahasa Inggris atau bahasa
Indonesia yang dapat berguna untuk keperluan ilmiah seperti meneliti
sifat-sifat dari suatu bentuk bahasa alami maupun untuk keperluan
sehari-sehari, dalam hal ini memudahkan interaksi antara manusia
dengan komputer. Adapun bidang-bidang pengetahuan yang berhubungan
dengan pengolahan bahasa alami adalah sebagai berikut :
- Fonetik dan fonologiFonetik dan fonologi merupakan apa-apa yang berhubungan dengan suara yang menghasilkan kata yang dapat dikenali. Bidang ini sangat penting dalam aplikasi yang menggunakan metode speech-based system.
- MorfologiMorfologi merupakan cabang pengetahuan tentang bentuk dan kata yang dimanfaatkan untuk membedakan satu kata dengan kata lainnya yang dapat dipisahkan antara kata dan elemen lain seperti tanda baca.
- SintaksisSintaksis merupakan pemahaman tentang urutan kata dan pembentukan kalimat dan hubungan antar kata tersebut dalam proses perubahan bentuk dari kalimat menjadi sesuatu yang tersusun secara sistematis.
- SemantikSemantik merupakan pemetaan bentuk struktur sintaksis dengan memanfaatkan tiap kata ke dalam bentuk yang lebih mendasar dan tidak tergantung dengan struktur kalimat tersebut.
- PragmatikPragmatik merupakan apa-apa yang berkaitan dengan tingkatan pengetahuan masing-masing konteks yang berbeda tergantung pada situasi dan tujuan pembuatan sistem.
- Discourse knowledgeDiscourse knowledge merupakan pengenalan apakah suatu kalimat yang sudah dibaca dan dikenali sebelumnya dalam mempengaruhi arti dari kalimat selanjutnya. Pada informasi ini penting diketahui dalam melakukan pengolahan arti terhadap kata ganti orang dan untuk mengartikan aspek sementara dari informasi yang akan dikelola.
- World knowledgeWorld knowledge merupakan hal yang berkaitan dengan arti dari sebuah kata secara umum dan apakah ada arti khusus bagi suatu kata dalam suatu percakapan dengan konteks tertentu.Adapun jenis-jenis aplikasi yang terdapat pada pemrosesan bahasa alami antara lain adalah sebagai berikut :
- Text-based applicationText-based application merupakan apa-apa yang mencakup segala macam aplikasi yang melakukan terhadap teks tertulis seperti berita di surat kabar, buku, e-mail dan lain sebagainya. Contoh penerapan yang digunakan dalam aplikasi ini antara lain adalah mencari topik tertentu dari buku yang ada di sebuah perpustakaan, mencari nama pengirim dari surat atau e-mail, dan menerjemahkan dokumen dari satu bahasa ke bahasa yang lainnya. Akan tetapi, tidak semua sistem dapat melakukan hal yang demikian, contohnya pada pencarian topik dari suatu buku di perpustakaan dapat dilakukan dengan pendekatan sistem database yang lengkap. Salah satu bentuk yang menarik adalah jika sistem diminta mencari isi dari suatu buku atau blog, dengan melakukan pendekatan yang dilakukan oleh manusia jika menghadapi suatu tes reading and comprehension.
- Dialogue-based applicationDialogue-based application merupakan pendekatan yang melibatkan bahasa lisan atau pengenalan suara. Akan tetapi, pada bidang ini pendekatan juga dilakukan dengan memasukkan interaksi dengan cara memasukkan teks pertanyaan melalui keyboard. Aplikasi yang sering digunakan dalam bidang ini antara lain seperti sistem tanya jawab dimana natural language digunakan dalam mendapatkan informasi dari sebuah database, sistem pelayanan melalui telepon, kontrol suara yang terdapat pada alat elektronik, sistem problem-solving yang membantu untuk melakukan penyelesaian masalah yang umum dihadapi dalam suatu pekerjaan. Untuk sistem yang dapat melakukan interaksi melalui bahasa lisan ada pada bagian speech recognition yang merupakan bagian terpisah dari natural language.Adapun istilah-istilah yang terdapat dalam pemrosesan bahasa alami adalah sebagai berikut :
- ParsingParsing merupakan proses untuk mengurai kalimat menjadi bentuk kata-kata dan frasa-frasa. Menurut Klas Buren terdapat dua model parsing yaitu :
- Keyword based parsing yaitu model parsing yang sederhana dan efektif dalam mengterjemahkan teks input. Keyword based parsing tidak dapat melibatkan pengetahuan sintaks. Dalam praktek keyword based parsing bisa berjalan baik dengan sederhana (dalam pengertian sintaksisnya memiliki sedikit arti) dan input umum (dalam domain tetentu) tetapi memiliki masalah pada input yang lebih rumit dan tidak umum.
- Grammar based parsing yaitu cara parsing yang lebih kompleks dimana dalam parsing ini melibatkan pengetahuan dalam sintaksis. Secara teori memiliki keakuratan lebih tinggi dalam memahami dan mengerti arti dari input yang diberikan, akan tetapi pada grammar based parsing memiliki kendala dalam performa atau kinerjanya karena diperlukan komputasi atau perhituangan serta kata-kata dan struktur kalimat yang diberikan harus dimengerti. Dalam penerapan aplikasinya, grammar based parsing memiliki potensi yang sangat tinggi dalam memahami input dengan baik tetapi sangat sulit dalam membuat desain.
- StemmingPengertian Stemming :
- Menurut Lily stemming merupakan proses untuk mencari akar (root) dari kata dengan menghilangkan imbuhan yang melekat dalam sebuah kata. Dengan kata lain stemming adalah proses untuk mencari kata dasar dari input kata yang diberikan dengan menghilangkan imbuhan yang melekat pada kata input.
- Jelita Asian menyatakan bahwa stemming dapat digunakan untuk menghilangkan awalan atau akhiran, sisipan dari kata yang akan diaplikasikan pada pencarian teks, mesin translasi (mesin penerjemah), peringkasan dokumen dan pengklasifikasian teks. Contoh stemming antara lain “membaca” dikonstruksi dari awalan “me”+”baca”, awalam “me” dihilangkan sehingga hasil stemming yang diharapkan adalah kata dasar “baca”.
Proses stemming melibatkan daftar kata yang di sebut “stop word”
yang berisi kata-kata yang tidak perlu lagi dilakukan stemming karena
sudah merupakan kata dasar atau kata yang tidak mungkin dilakukan
stemming, serta dilibatkan kamus kata dasar yang digunakan untuk
menguji apakah kata yang dilakukan proses stemming merupakan kata
dasar.
Referensi
:
Tidak ada komentar:
Posting Komentar