Pernahkah Kerabat Nara merasa penasaran akan pangkalan data bahasa kita? Jika pernah, berarti kita sama. Sebelum mengenyam pendidikan S-1, saya pun pernah bertanya-tanya berapa banyak himpunan data bahasa Indonesia. Akhirnya, rasa penasaran saya terjawab oleh salah satu kajian interdisplin linguistik yang bernama linguistik korpus. 

Dalam KBBI V, korpus yang tergolong ranah linguistik didefinisikan sebagai ‘kumpulan ujaran yang tertulis atau lisan yang digunakan untuk menyokong atau menguji hipotesis tentang struktur bahasa’. Dalam kajian linguistik, penggunaan korpus itu sendiri lebih menitikberatkan pada bukti pemakaian bahasa (linguistic evidence). Hal itu tersebab teks yang dikumpulkan sebagai korpus merupakan teks alami yang tidak dibuat-buat. Teks alami tersebut, antara lain, berupa berita, novel, jurnal, dan tulisan blog. Nah, sangat besar kemungkinan bahwa teks yang Kerabat Nara hasilkan menjadi korpus bahasa kita, lo. 

Pada umumnya, korpus diklasifikasikan menjadi empat, yaitu korpus umum, korpus khusus, korpus tetap, dan korpus dinamis. Mari kita telaah satu per satu. 

Korpus Umum 

Korpus ini dibuat untuk penelitian linguistik umum. Teks yang dimasukkan sebagai data pun disaring agar ada perimbangan secara proposional. Korpus umum cenderung berukuran besar dan kerap disebut sebagai korpus inti. Contoh korpus umum adalah British National Corpus (BNC) atau Bank of English yang menggambarkan variasi bahasa secara keseluruhan. 

Korpus Khusus

Korpus ini dibuat untuk penelitian linguistik bertopik tertentu dalam kurun waktu yang tertentu pula. Misal, korpus penelitian yang bertujuan membandingkan gaya bahasa jurnalistik antara Kompas dan Tempo pada 2021. Korpus khusus cenderung berukuran kecil. 

Korpus Tetap

Sama seperti korpus khusus, korpus tetap ini juga dibuat untuk penelitian linguistik khusus. Yang membedakannya dengan korpus khusus ialah komposisi dan besarannya yang bersifat tetap. Isi korpus tetap tidak akan mengalami perubahan dari waktu ke waktu. 

Korpus Dinamis

Seperti namanya, korpus dinamis ini akan selalu bertambah dari masa ke masa. Baik dari segi ukuran maupun dari segi komposisi, korpus dinamis akan selalu berubah. Korpus dinamis kerap disebut sebagai korpus rujukan. Kegunaan utamanya ialah memonitor perkembangan bahasa kontemporer. 

Setelah mengetahui empat jenis korpus di atas, menurut Kerabat Nara, korpus yang berisi himpunan data kebahasaan Indonesia tergolong korpus apa? Jawab di kolom komentar, ya, Kerabat Nara. 

Referensi: Kushartanti, dkk. 2009. Pesona Bahasa. Jakarta: Gramedia Pustaka Utama

Penulis: Dessy Irawan

Penyunting: Ivan Lanin