Rabu, 25 Februari 2015

Pemrosesan Bahasa Alami oleh : Amiriyanti & Duwi Juliyatin


Pemrosesan Bahasa Alami
oleh : Amiriyanti & Duwi Juliyatin

Pemrosesan Bahasa Alami merupakan salah satu bidang ilmu komputer, kecerdasan buatan dan bahasa yang berkaitan dengan interaksi antara komputer dan bahasa alami manusia yang secara umum digunakan oleh manusia dalam berkomunikasi satu sama lain. Tujuan utama dari belajar pemrosesan bahasa alami adalah membuat mesin yang mampu berinteraksi dengan bahasa alami manusia baik berupa suara/ucapan (spoken language) atau berupa tulisan seperti bahasa Inggris atau bahasa Indonesia yang dapat berguna untuk keperluan ilmiah seperti meneliti sifat-sifat dari suatu bentuk bahasa alami maupun untuk keperluan sehari-sehari, dalam hal ini memudahkan interaksi antara manusia dengan komputer. Adapun bidang-bidang pengetahuan yang berhubungan dengan pengolahan bahasa alami adalah sebagai berikut :
  1. Fonetik dan fonologi
    Fonetik dan fonologi merupakan apa-apa yang berhubungan dengan suara yang menghasilkan kata yang dapat dikenali. Bidang ini sangat penting dalam aplikasi yang menggunakan metode speech-based system.
  2. Morfologi
    Morfologi merupakan cabang pengetahuan tentang bentuk dan kata yang dimanfaatkan untuk membedakan satu kata dengan kata lainnya yang dapat dipisahkan antara kata dan elemen lain seperti tanda baca.
  3. Sintaksis
    Sintaksis merupakan pemahaman tentang urutan kata dan pembentukan kalimat dan hubungan antar kata tersebut dalam proses perubahan bentuk dari kalimat menjadi sesuatu yang tersusun secara sistematis.
  4. Semantik
    Semantik merupakan pemetaan bentuk struktur sintaksis dengan memanfaatkan tiap kata ke dalam bentuk yang lebih mendasar dan tidak tergantung dengan struktur kalimat tersebut.
  5. Pragmatik
    Pragmatik merupakan apa-apa yang berkaitan dengan tingkatan pengetahuan masing-masing konteks yang berbeda tergantung pada situasi dan tujuan pembuatan sistem.
  6. Discourse knowledge
    Discourse knowledge merupakan pengenalan apakah suatu kalimat yang sudah dibaca dan dikenali sebelumnya dalam mempengaruhi arti dari kalimat selanjutnya. Pada informasi ini penting diketahui dalam melakukan pengolahan arti terhadap kata ganti orang dan untuk mengartikan aspek sementara dari informasi yang akan dikelola.
  7. World knowledge
    World knowledge merupakan hal yang berkaitan dengan arti dari sebuah kata secara umum dan apakah ada arti khusus bagi suatu kata dalam suatu percakapan dengan konteks tertentu.
    Adapun jenis-jenis aplikasi yang terdapat pada pemrosesan bahasa alami antara lain adalah sebagai berikut :
  1. Text-based application
    Text-based application merupakan apa-apa yang mencakup segala macam aplikasi yang melakukan terhadap teks tertulis seperti berita di surat kabar, buku, e-mail dan lain sebagainya. Contoh penerapan yang digunakan dalam aplikasi ini antara lain adalah mencari topik tertentu dari buku yang ada di sebuah perpustakaan, mencari nama pengirim dari surat atau e-mail, dan menerjemahkan dokumen dari satu bahasa ke bahasa yang lainnya. Akan tetapi, tidak semua sistem dapat melakukan hal yang demikian, contohnya pada pencarian topik dari suatu buku di perpustakaan dapat dilakukan dengan pendekatan sistem database yang lengkap. Salah satu bentuk yang menarik adalah jika sistem diminta mencari isi dari suatu buku atau blog, dengan melakukan pendekatan yang dilakukan oleh manusia jika menghadapi suatu tes reading and comprehension.
  2. Dialogue-based application
    Dialogue-based application merupakan pendekatan yang melibatkan bahasa lisan atau pengenalan suara. Akan tetapi, pada bidang ini pendekatan juga dilakukan dengan memasukkan interaksi dengan cara memasukkan teks pertanyaan melalui keyboard. Aplikasi yang sering digunakan dalam bidang ini antara lain seperti sistem tanya jawab dimana natural language digunakan dalam mendapatkan informasi dari sebuah database, sistem pelayanan melalui telepon, kontrol suara yang terdapat pada alat elektronik, sistem problem-solving yang membantu untuk melakukan penyelesaian masalah yang umum dihadapi dalam suatu pekerjaan. Untuk sistem yang dapat melakukan interaksi melalui bahasa lisan ada pada bagian speech recognition yang merupakan bagian terpisah dari natural language.
    Adapun istilah-istilah yang terdapat dalam pemrosesan bahasa alami adalah sebagai berikut :
  1. Parsing
    Parsing merupakan proses untuk mengurai kalimat menjadi bentuk kata-kata dan frasa-frasa. Menurut Klas Buren terdapat dua model parsing yaitu :
  • Keyword based parsing yaitu model parsing yang sederhana dan efektif dalam mengterjemahkan teks input. Keyword based parsing tidak dapat melibatkan pengetahuan sintaks. Dalam praktek keyword based parsing bisa berjalan baik dengan sederhana (dalam pengertian sintaksisnya memiliki sedikit arti) dan input umum (dalam domain tetentu) tetapi memiliki masalah pada input yang lebih rumit dan tidak umum.
  • Grammar based parsing yaitu cara parsing yang lebih kompleks dimana dalam parsing ini melibatkan pengetahuan dalam sintaksis. Secara teori memiliki keakuratan lebih tinggi dalam memahami dan mengerti arti dari input yang diberikan, akan tetapi pada grammar based parsing memiliki kendala dalam performa atau kinerjanya karena diperlukan komputasi atau perhituangan serta kata-kata dan struktur kalimat yang diberikan harus dimengerti. Dalam penerapan aplikasinya, grammar based parsing memiliki potensi yang sangat tinggi dalam memahami input dengan baik tetapi sangat sulit dalam membuat desain.
  1. Stemming
    Pengertian Stemming :
  • Menurut Lily stemming merupakan proses untuk mencari akar (root) dari kata dengan menghilangkan imbuhan yang melekat dalam sebuah kata. Dengan kata lain stemming adalah proses untuk mencari kata dasar dari input kata yang diberikan dengan menghilangkan imbuhan yang melekat pada kata input.
  • Jelita Asian menyatakan bahwa stemming dapat digunakan untuk menghilangkan awalan atau akhiran, sisipan dari kata yang akan diaplikasikan pada pencarian teks, mesin translasi (mesin penerjemah), peringkasan dokumen dan pengklasifikasian teks. Contoh stemming antara lain “membaca” dikonstruksi dari awalan “me”+”baca”, awalam “me” dihilangkan sehingga hasil stemming yang diharapkan adalah kata dasar “baca”.
Proses stemming melibatkan daftar kata yang di sebut “stop word” yang berisi kata-kata yang tidak perlu lagi dilakukan stemming karena sudah merupakan kata dasar atau kata yang tidak mungkin dilakukan stemming, serta dilibatkan kamus kata dasar yang digunakan untuk menguji apakah kata yang dilakukan proses stemming merupakan kata dasar.

Referensi :

Tidak ada komentar:

Posting Komentar