Pemrosesan Bahasa Alami (Natural Language Processing) terdiri dari Pengertian Bahasa Alami (Natural Language Understanding) agar kecerdasan buatan dapat mengerti bahasa manusia dan Penghasilan Bahasa Alami (Natural Language Generation) agar kecerdasan buatan dapat melakukan percakapan selayaknya manusia. Secara umum Natural Language Processing (NLP) merupakan multi-displin dari 3 bidang yaitu kecerdasan buatan, ilmu komputer, dan bahasa manusia (mungkin masih ada bidang-bidang lainnya). Menurut saya bahasa dalam komputer secara umum dibagi menjadi bahasa manusia merupakan tingkat atas, bahasa pemrograman merupakan tingkat menengah, dan bahasa mesin merupakan tingkat bawah.
Penerapan NLP
Contoh penerapan NLP:
- Robot Percakapan
- Rekognisi Pembicaraan
- Klasifikasi Konten
- Analisa Sentimen
- Penerjemahan Bahasa
- dan lain-lainnya
Proses NLP
Proses NLP dapat dibagi menjadi 9:
- Segmentasi: pemecahan paragraf menjadi kalimat-kalimat.
- Tokenisasi: pemecahan kalimat menjadi kata-kata.
- Stemming: mengembalikan kata menjadi bentuk dasarnya.
- Lemmatizasi: mengembalikan kata menjadi makna dasarnya.
- Identifikasi Kata-Kata Pelengkap
- Penguraian Variabel-Variabel Ketergantungan: merelasikan satu kata, kalimat, paragraf, dengan lainnya.
- Tag Bagian Dari Percakapan: merelasikan masing-masing bagian dengan konteksnya.
- Pengenalan Entitas Bernama: pengenalan nama-nama dan istilah-istilah yang dikenal oleh manusia.
- Memotong dan Menyabung: menggabungkan hasil pengertian kecerdasan buatan tersebut.
Fase NLP
Fase NLP:
- Lexical Analysis: analisa kata-kata dan vokabulari bahasa.
- Syntatic Analysis: analisa penempatan kata-kata.
- Semantic Analysis: analisa relasi kata-kata.
- Discourse Integration: integrasi konteks.
- Pragmatic Analysis: makna dari bahasa.