Selasa, 24 Februari 2015

Pemrosesan Bahasa Alami (Try Wahyudinata - D03112021)

TRY WAHYUDINATA
D03112021

Pemrosesan Bahasa Alami

Natural Language Processing (NLP) atau dikenal juga dengan Pemrosesan Bahasa Alami didefinisikan sebagai sebuah metode dalam bidang Artificial Intelligence (AI) yang berfungsi untuk berhubungan dengan komputer dalam bahasa alami atau bahasa yang dipahami oleh manusia seperti bahasa Indonesia, bahasa Inggris, ataupun bahasa alami manusia yang lainnya. 

Pemrosesan Bahasa Alami ini memiliki tujuan untuk melakukan proses pembuatan suatu model komputasi dari bahasa (linguistik), sehingga diharapkan dapat terjadi suatu interaksi antara manusia dengan komputer dimana bahasa alami (bahasa sehari-hari) sebagai perantaranya.

Sebuah sistem Pemrosesan Bahasa Alami diharuskan memperhatikan beberapa pengetahuan terhadap bahasa yang digunakan, baik itu dari segi kata yang akan digunakan, bagaimana kata-kata tersebut divariasikan untuk menghasilkan suatu kalimat, apa arti sebuah kata, serta apa fungsi dari sebuah kata dalam sebuah kalimat dan sebagainya. Kemampuan manusia untuk mengerti juga harus kita pertimbangkan dan kemampuan tersebut bisa didapat dari pengetahuan yang didapat secara terus menerus atau continue selama hidup

Peranan Pengetahuan dalam bahasa adalah sebagai berikut,
Komunikasi dengan bahasa alami (bahasa sehari-hari) baik itu teks atau ucapan akan bergantung pada pengetahuan dari domain pembicaraan.
Pemahaman bahasa tidak hanya dapat ditransmisikan dari kata-kata, akan tetapi membutuhkan inferensi tentan tujuan dan asumsi-asumsu dari pembicara dan tentang konteks sebuah interaksi.
Implementasi dari progra Pemrosesan Bahasa Alami membutuhkan representasi dari sejumlah besar pengetahuan dan alasan-alasan.

Bidang Pengetahuan dalam Bahasa Alami (bahasa sehari-hari)
Untuk mengatasi kekompleks-an dari bahasa ini didefinisikan tingkat analisis bahasa alami: 
1. Prosody, memahami ritme dan intonasi dari sebuah bahasa
2. Phonology, menguji suara yang dikombinasikan untuk membentuk sebuah bahasa
3. Morphology, pengujian mengenai komponen-komponen (morfem-morfem) yang membentuk kata-kata. Termasuk aturan-aturan dalam pengembangan formasi kata-kata seperti efek dari prefix (un-, non-, anti-, dll), dan sufiks (-ing, -ly, dll) yang mengubah arti dari akar sebuah kata.
4. Syntax, pemahaman tentang urutan kata dalam pembentukan sebuah kalimat dan hubungan antar kata tersebut dalam proses perubahan bentuknya dari kalimat menjadi bentuk yang lebih sistematis. Meliputi proses pengaturan tata letak suatu kata dalam sebuah kalimat akan membentuk kalimat yang mudah dikenali. Selain itu dapat pula diketahui bagian-bagian dari sebuah kalimat dalam suatu kalimat yang lebih besar lagi. Contohnya, kalimat S dibentuk dari noun phrase (NP) dan verb phrase (VP)
Sintaksis: yaitu S à NP, VP
Dan selanjutnya:
NP à DET, N
VP à V, NP
NP à N
5. Semantics, merupaka pemetaan bentuk struktur sintaksis dengan memanfaatkan tiap-tiap kata ke dalam bentuk yang lebih mendasar dan tidak bergantung pada struktur kalimat. Semantik juga mempelajari arti suatu kata dan bagaimana dari arti kata-arti kata tersebut membentuk suatu arti dari kalimat yang seutuhnya. 
6. Pragmatics, merupakan analisa pada cara dimana bahasa digunakan dan efeknya pada si pendengar bahasa tersebut.
7. World Knowledge, mencakup arti sebuah kata secara umum dan apakah ada arti khusus bagi suatu kata tersebut dalam suatu percakapan dengan konteks tertentu.
Selain 7 poin diatas, masih ada lagi sebuah masalah yang cukup menantang dalam Bahasa Alami, yaitu ambiguitas atau makna ganda dari suatu kata atau suatu kalimat tertentu.

SISTEM PEMROSESAN BAHASA ALAMI
Suatu sistem Pemrosesan Bahasa Alami secara lisan dibagi dalam tiga bentuk sub-sistem, yaitu antara lain:
1) Sub-Sistem Natural Language Processing (NLP), sub-sistem ini berfungsi untuk melakukan  pemrosesan secara simbolik terhadap teks. Beberapa bentuk aplikasi dari sub-sistem  ini  adalah  penerjemah bahasa alami (misalnya transalsi dari Bahasa Indonesia ke Bahasa Inggris ), sistem  pemeriksa struktur bahasa, sistem yang dapat menyimpulkan suatu narasi dan sebagainya.
2) Sub-sistem Text  to Speech (TTS), sub-sistem ini berfungsi untuk mengubah bahasa tulisan (teks) menjadi bahasa lisan (ucapan).
3) Sub-Sistem Speech Recognition (SR), sub-sistem ini merupakan kebalikan dari teknologi Text to Speech, yaitu sebuah sistem yang berfungsi untuk mengubah/mengenali suatu bahasa lisan (ucapan) menjadi bahasa tulisan (teks).

Berbeda dengan sistem lain yang bersifat generik, teknik yang digunakan dalam Pemrosesan Bahasa Alami akan bersifat  sangat language dependent atau bergantung pada bahasa yang dipakai. Suatu sistem atau teknik yang digunakan untuk suatu bahasa yang tidak mudah diterapkan untuk bahasa lainnya.

Seperti yang telah dijelaskan sebelumnya, bahwa bahasa dapat diklasifikasikan menjadi bahasa buatan dan bahasa alami. Bahasa buatan digunakan untuk memenuhi kebutuhan tertentu dan dirancang dengan  sangat hati-hati agar memenuhi aturan-aturan dalam bahasa yang diperlukan untuk kemudahan pemrosesannya.

Akan tetapi, bahasa alami tumbuh secara alami untuk memenuhi kebutuhan komunikasi antar sesama manusia. Bahasa alami tidak dirancang unutk memperhatikan berbagai kendala yang ada untuk kemudahan pemrosesannya. Akibatnya, Pemrosesan Bahasa Alami jauh lebih sulit untuk dilakukan dibandingkan dengan bahasa buatan. Selin itu, beberapa masalah dasar dalam bahasa alami masih belum terpecahkan bahkan hingga saat ini.

Implementasi dari Pemrosesan Bahasa Alami tidak mudah dilakukan. Beberapa alasan yang cukup menyulitkan Pemrosesan Bahasa Alami adalah sebagai berikut:
1) Dalam bahasa alami, sering terjadi ambiguitas atau makna ganda. Fenomena ini sering terjadi pada  berbagai tingkatan implementasi bahasa, mulai dari tanda baca dan simbol huruf sebagai unit terkecil bahasa tulisan, frasa, tingkat kata, kalimat, bahkan paragraf. Simbol titik (“.”) tidak selalu berfungsi sebagai tanda akhir dari sebuah kalimat, akan tetapi juga dapat menjadi bagian dari singkatan-singkatan (seperti Ir., Dr., Jl.) atau bagian dari sebuah bilangan. 
2) Jumlah kosa kata (vocabulary) dalam bahasa alami sangatlah besar dan selalu berkembang dari waktu ke waktu.

Karakteristik-karakteristik diatas menyebabkan sulitnya melakukan Pemrosesan Bahasa Alami. Apalagi manusia itu sendiri menghadapi masalah pada ambiguitas tersebut berdasarkan analisis konteks yang  didukung oleh pengetahuan yang dimilikinya. Komputer atau mesin yang tidak dilengkapi pengetahuan seperti itu akan sulit melakukannya. Jika Pemrosesan Bahasa Alami diterapkan untuk aplikasi bahasa lisan, kesulitan-kesulitan lain yang mungkin terjadi. Dalam bahasa lisan (ucapan), manusia sangat sering membentuk ucapan yang tidak sesuai dengan aturan-aturan yang berlaku dalam bahasa yang digunakan.




Referensi:

Tidak ada komentar:

Posting Komentar