PEMROSESAN BAHASA ALAMI
Bahasa merupakan bagian yang terpenting dalam kehidupan manusia sehari-hari,baik dalam bentuk tulisan yaitu catatan dari ilmu pengetahuan yang didapat oleh manusia dari satu generasi ke generasi berikutnya,sedangkan dalam bentuk lisan merupakan komunikasi antar sesama individu.
Natural Language Processing adalah sebuah proses pembuatan model komputasi dari bahasa,sehingga dapat terjadi suatu interaksi antara manusia dengan komputer dengan perantara bahasa alami,yaitu bahasa yang sering digunakan dalam kehidupan sehari-hari.
Sebuah Natural Language System harus mampu mengerti terhadap bahasa yang ada di dalamnya,baik itu dari segi fungsi kata,bagaimana apabila kata-kata tersebut digabung dapat menjadi sebuah kalimat,arti dari kata,dan fungsi kata tersebut dalam sebuah kalimat.Dan tentunya ada faktor yang paling penting dalam bahasa yaitu kemampuan manusia untuk mengerti dari bahasa yang diberikan.
Didalam pemrosesan bahasa alami (Natural Language Processing) mengenal beberapa tingkat pemrosesan yaitu :
1. Fonetik Dan fonologi : proses pemrosesan suara yang menghasilkan kata yang dapat dikenali,pemrosesan ini menggunakan metode speech based system.
2. Morfologi : pemrosesan kata dan bentuknya sebagai pembeda antara satu kata dengan yang lainnya.pada pemrosesan tingkat ini dipisahkan antara kata dan elemen lain.
3. Sintaksis : pemrosesan tentang urutan kata didalam pembentukan kata dan relasi antar kata itu dalam proses perubahan bentuk kalimat menjadi sebuah bentuk kalimat yang sistematis.dalam proses ini terjadi pengaturan tata letak kata sebagai faktor pembentuk kalimat yang dapat dikenali.
4. Semantik : mempelajari arti kata dan bagaimana dari arti kata tersebut dapat membentuk suatu arti dari kalimat yang utuh.
5. Pragmatik : berkaitan dengan tujuan pembuatan sistem dengan konteks yang berbeda.
6. Discourse Knowledge : proses terjadinya pengenalan suatu kalimat yang sudah dikenali sebelumnya dan akankah mempengaruhi arti kalimat setelahnya.Informasi ini penting untuk melakukan pengolahan arti terhadap kata ganti,misalnya kata ganti orang dan informasi ini penting untuk mengartikan aspek sementara dari informasi.
7. World Knowledge : mencakup arti kata secara umum dan arti khusus jika ada dalam suatu percakapan dengan konteks tertentu.
Pengertian ini tidak bersifat terpaku, dalam setiap bahasa alami yang ada, selalu terdapat definisi yang lebih spesifik sesuai dengan jenis bahasa tersebut. Beberapa masallah mungkin bisa mengambil sebagian dari pendekatan tersebut dan mungkin melakukan tambahan preses sesuai dengan jenis bahasa yang digunakan dan sistem yang dibuat.
Masalah yang dihadapi dalam Natural Language yaitu ambiguitas yaitu makna ganda dari suatu kata atau kalimat.Ambiguitas ini dapat terjadi di semua tingkat pemrosesan di atas.
Macam-macam aplikasi yang bisa dibuat pada bidang bidang Natural Language Processing adalah :
1. Text – text application dan dialogue – based applications. Text – text application mencakup semua aplikasi yang memproses terhadap text yang ditulis seperti buku bacaan,koran,dan lain-lain.
Contoh penggunaan : mencari topik buku dari perpustakaan,mencari isi dari surat atau e-mail.
2. Dialogue – based application.Pendekatan ini melibatkan pengenalan suara, akan tetapi bidang ini juga melibatakan interaksi dengan cara memasukkan teks melalui keyboard.
Contoh penggunaan : sistem tanya jawab dengan database,sistem otomatis pelayanan melalui telepon,control suara pada peralatan elektronik,sistem problem – solving.
Lalu di Natural Language Processing ada Grammar yaitu aturan kata yang menentukan apakah suatu kumpulan kata dapat diterima sebagai kalimat oleh bahasa tersebut.Dari grammar kita dapat mempelajari bahasa dari segi struktur dan bukan dari segi makna bahasa itu sendiri.
Lalu ada Parsing,yaitu proes analisa suatu kumpulan kata dengan memisahkan kata tersebut dan menentukan struktur sintaksis dari kata tersebut.Gramatika yang dipakai pasti berkaitan dengan proses parsing apa yang digunakan.Dari pendekatan dalam mengenali struktur kalimat,parsing di bagi dua bagian besar yaitu Top Down parsing dan Bottom Up parsing. Top Down parser memulai pemeriksaan dan mecoba mencari bentuk simbol berikutnya dan Bottom Up parsing bekerja sebaliknya.
Dan ada semantik,yaitu proses yang sulit karena definisinya tergantung pada maksud dalam kalimat.didalam semantik ada himpunan rule dalam dasar pengetahuan untuk memaparkan sebuah kalimat.Pendekatan yang dipakai adalah pendekatan Semantic Grammar yang dipadukan dengan Dictionary dan Template Grammar.
Pada Semantik Grammar, dipakai sekumpulan aturan yang bersifat sintaksis, semantis, dan pragmatis. Hasil dari pasing dengan grammar ialah langsung seperti reprentasi semantis dari kalimat yang dibuat. Dengan pendekatan tersebut, interprentasi dari rule yang bersangkutan lebih mudah karena informasi semantic yang di butuhkan dapat dilihat dari rule yang dipakai. Terdapat beberapa kekurangan dari pendekatan ini yaitu domain sistem yang tidak begitu besar, dan domain yang akan memerlukan aturan yang baru yang lebih sesuai. Tidak hanya terjadi pembengkakan jumlah rule yang digunakan, ini terjadi karena langsung mengacu ke semantik maka terdapat banyak generalisasi linguistik yang harus di rinci lebih jauh.
refrensi:
yuliana.lecturer.pens.ac.id (pdf)
Tidak ada komentar:
Posting Komentar