Peranan Pengetahuan dalam Bahasa
1. Komunikasi dengan bahasa alami yaitu dengan teks atau ucapan, bergantung pada pengetahuan dari domain pembicaraan .
2. Pemahaman bahasa bukan hanya ditransmisi dari kata-kata; tapi membutuhkan inferensi tentang tujuan dan asumsi-asumsi dari pembicara dan tentang konteks interaksi
3. penerapan dari program pemahaman bahasa alami sangat membutuhkan representasi dari sejumlah besar pengetahuan dan alasan-alasan.
Masalah Bahasa Alami
1. Bahasa adalah suatu fenomena yang kompleks, yang melibatkan berbagai proses, misalnya : pengenalan suara atau huruf yang tercetak, parsing sintak, inferensi semantic tingkat tinggi dan komunikasi dari isi emosional melalui ritme dan inflection .
2. Masalah dalam pemrosesan bahasa ini secara garis besar di bagi menjadi dua:
• Pemrosesan teks ,yaitu yang ditulis menggunakan leksikal, sintaksis, dan pengetahuan semantic dari bahasa.
• Pemrosesan bahasa bicara, yaitu menggunakan semua informasi di atas, dan ditambahkan dengan informasi mengenai phonology.
Masalah Bahasa Alami
Dalam mengatasi kompleksitas dari bahasa alami didefinisikan tingkat analisis bahasa alami yaitu:
1. Prosody,yaitu mengerjakan ritme dan intonasi Bahasa.
2. Phonology yaitu menguji suara yang dikombinasikan untuk membentuk Bahasa.
3. Morphology yaitu mengenai komponen-komponen pembentuk kata-kata. Termasuk aturan-aturan pengembangan formasi kata-kata seperti efek dari prefix (un-, non-, anti-, dll), dan sufiks (-ing, -ly, dll) yang memodifikasi arti dari akar kata.
4. Syntax merupakan pemahaman tentang urutan kata dalam pembentukan kalimat dan hubungan antar kata tersebut dalam suatu proses perubahan bentuk dari kalimat menjadi bentuk yang lebih sistematis. Meliputi proses pengaturan tata letak kata dalam kalimat akan membentuk kalimat yang dapat dikenali. Selain itu dapat juga dikenali bagian-bagian kalimat pada suatu kalimat yang lebih besar. Contohnya kalimat S dibentuk dari noun phrase dan verb phrase .
Sintaksis: S NP, VP
Dan lalu :
NP DET, N
VP V, NP
NP N
5. Semantics, merupakan pemetaan bentuk struktur sintaksis,yaitu dengan memanfaatkan tiap kata ke dalam bentuk yang lebih mendasar dan tidak tergantung pada struktur kalimat. Semantik yaitu mempelajari arti dari suatu kata dan bagaimana dari arti kata tersebut dapat membentuk suatu arti dari kalimat yang utuh .
6. Pragmatics, merupakan studi pada cara dimana bahasa digunakan & efeknya pada si pendengar
7. World Knowledge yaitu mencakup arti sebuah kata secara umum dan apakah ada arti khusus bagi suatu kata dalam suatu percakapan dengan konteks tertentu.
Selain itu ada lagi satu masalah yang cukup menantang dalam Natural Language yaitu ambiguitas atau makna ganda dari suatu kata atau kalimat.
Pemrosesan Bahasa Alami
• Menurut Rich, pemrosesan bahasa alami dapat dibagi atas beberapa proses:
1. Morphological analysis adalah kata secara individu yang dianalisis ke dalam komponen-komponennya dan yang bukan kata, contohnya seperti tanda baca dipisahkan dari kata
2. Syntactic analysis adalah urutan linier dari kata ditransformasikan ke dalam struktur yang menunjukkan bagaimana pada kata saling berhubungan. Tata urutan kata yang melanggar aturan bahasa dalam pengkombinasian kata akan ditolak
3. Semantic analysis adalah dibuat mapping antara struktur sintaksis dan objek dalam domain kerja. Struktur dimana tidak ada mapping yang memiliki kemungkinan akan ditolak.
4. Discourse integration adalah dimana arti dari kalimat secara individu bergantung kepada kalimat-kalimat yang mendahului dan mungkin dapat mempengaruhi arti dari kalimat-kalimat yang mengikutinya
5. Pragmatic analysis adalah dimana struktur yang merepresentasikan apa yang diucapkan, diintepretasikan kembali guna menentukan apa arti sebenarnya.
Proses Sintaksis
• Proses sintaksis( parsing ), adalah suatu langkah dimana kalimat masukan secara flat dan diubah ke dalam struktur hirarkis yang memiliki hubungan dengan unit-unit arti dalam kalimat.
• Proses sintaksis berperan dalam pemahaman bahasa alami dikarenakan :
a. Proses semantic harus beroperasi dalam pilihan-pilihan kalimat. Jika tidak terdapat tahapan parsing sintaksis maka sistem semantic harus memutuskan atas pilihannya sendiri. Jika parsing dilakukan, maka akan membatasi pilihan-pilihan dari semantic
b. Tidak selalu dimungkinkan untuk mengekstrak arti kalimat tanpa menggunakan fakta gramatikal
• Komponen yang ddigunakan oleh sistem, yaitu:
a. Representasi deklaratif, (grammar), fakta sintaksis tentang Bahasa.
b. Prosedur (parser), dimana membandingkan grammar dengan kalimat-kalimat masukan untuk membentuk struktur yang dianalisis.
Gramatika
Grammar merupakan suatu bahasa atau dapat dilihat sebagai aturan yang menentukan apakah suatu kumpulan kata dapat diterima sebagai kalimat oleh bahasa tersebut. Grammar dari Chomsky Hierarchy yaitu Context Free Grammar lebih mudah dipahami perilakunya dan pengolahannya serta masih dapat diolah dalam bentuk program yang terstruktur. Suatu bahasa L dapat dijelaskan sebagai set dari string, string dibentuk dari bagian terkecil yang disebut symbol. Kelompok tertentu v dari symbol biasa dikenal sebagai alfabet atau perbendaharaan kata. Sebuah kalimat yang dapat dikenali dibentuk dengan berdasarkan aturan-aturan yang ada yang biasa disebut grammar. Sebuah grammar G dapat dibentuk dari 4 tuple yaitu: simbol non terminal, simbol terminal, simbol awal, dan aturan penulisan atau (rules). Definisinya adalah sebagai berikut:
Suatu kalimat tersebut apabila dicari pembentukannya melalui grammar G dapat dikatakan benar akan tetapi harus diingat bahwa kalimat dengan grammar yang benar hanya berarti benar secara struktural bukan berarti selalu benar dalam makna. Seperti kalimat ketika yang benar apabila berada dalam konteks “orang memakai alat” misalnya pesawat terbang. Sedangkan kalimat keempat justru sama sekali tidak mungkin dapat dimengerti maknanya, selain hanya akan menimbulkan tanda tanya bagi orang yang membaca. Dari grammar dapat mempelajari bahasa dari segi struktur dan bukan dari segi makna bahasa itu sendiri.
Sumber : http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CBsQFjAA&url=http%3A%2F%2Fapranolo.tif.uad.ac.id%2Fwp-content%2Fuploads%2F2014%2F12%2FBab-5-Natural-Language-Processing.pdf&ei=4w71VMXsFYW-mAXM2oGQDw&usg=AFQjCNHu1sL_fQP-zEC7LCcEMLvOeXIXhA&sig2=yrmTmh5qY-s4DYJCPwyOHA&bvm=bv.87269000,d.dGY
Tidak ada komentar:
Posting Komentar