Sadar atau tidak dan suka atau tidak, sebagian besar dari kita pasti mengandalkan kecanggihan komputer untuk melakukan banyak hal. Kini, dengan mudah kita bisa mendengarkan lagu, menonton film, membaca cerita, dan membeli buku dengan memasukkan kata kunci ke dalam komputer yang terhubung dengan internet. Bahkan, lewat ponsel pintar pun, segala hal itu dapat kita lakukan dengan lebih praktis.

Komputer bisa memproses bahasa sebagaimana manusia. Namun, manusialah yang harus melakukan rekayasa pemrograman terhadap komputer agar bisa memproses dan mengelola data berupa bahasa. Bidang linguistik yang berhubungan dengan itu adalah linguistik komputasi.

Linguistik komputasi (computational linguistik), menurut Kamus Linguistik Edisi Keempat (2009), adalah cabang linguistik yang mempergunakan teknik komputer dalam penelitian bahasa dan kesusastraan. Musthofa dalam tulisannya yang berjudul “Computational Linguistics (Model Baru Kajian Linguistik dalam Perspektif Komputer)” merangkum definisi linguistik komputasi—atau sering juga disebut sebagai natural language processing (NLP)—berdasarkan pendapat para ahli sebagai berikut.

  1. Sebuah studi ilmiah mengenai bahasa dari sudut pandang komputer
  2. Sebuah kajian interdisipliner bahasa yang melibatkan bahasa natural dan komputer
  3. Sebuah studi yang menitikberatkan pada pemrosesan bahasa natural dengan berbagai fenomenanya secara otomatis oleh komputer
  4. Studi tentang rekayasa program aplikasi komputer untuk pemrosesan bahasa natural dengan berbagai kompleksitasnya

Cabang ini termasuk ke dalam linguistik terapan yang bersifat interdisipliner. Tentu saja, linguistik komputasi harus mencakup linguistik umum, seperti fonologi, morfologi, sintaksis, semantik, dan pragmatik. Leksikografi pun turut dimanfaatkan dalam penyusunan prinsip pengodean dan entri leksikal. Sementara itu, dalam linguistik komputasi, psikolinguistik juga digunakan untuk memetakan pemrosesan bahasa manusia yang kemudian direkayasa ke dalam program komputer. Perlu dicatat pula, semua kajian interdisipliner tersebut diolah melalui logika matematika.

Kita bisa melihat bahwa linguistik komputasi ini cukup rumit. Ternyata, di balik Google Translate, robot obrolan (chatbot), pengecek plagiarisme, bahkan asisten pribadi bernama Siri, bahasa memiliki peranan yang penting. Pada waktu saya mengerjakan tulisan ini pun, Google bekerja dengan menarik garis merah di bawah kata-kata yang saltik, yang menunjukkan ketelitiannya yang menolong—kadang memanjakan—manusia.

 

Rujukan:

  • Kridalaksana, Harimurti. 2009. Kamus Linguistik. Edisi Keempat. Jakarta: Gramedia Pustaka Utama.
  • Musthofa. 2010. “Computational Linguistics (Model Baru Kajian Linguistik dalam Perspektif Komputer)”. Dalam Jurnal Adabiyyāt: Jurnal Bahasa dan Sastra Vol. IX, No. 2 (hlm. 247–271). Yogyakarta: Universitas Islam Negeri Sunan Kalijaga.
  • Purwarianti, Ayu. 2019. “Bagaimana AI dapat mempelajari bahasa manusia untuk mempermudah hidup kita”. Diakses pada 15 Juli 2021.

Penulis: Yudhistira

Penyunting: Ivan Lanin