
Korpus: Saksi Bisu Perkembangan Bahasa
Pernahkah Kerabat Nara merasa penasaran akan pangkalan data bahasa kita? Jika pernah, berarti kita sama. Sebelum mengenyam pendidikan S-1, saya pun pernah bertanya-tanya berapa banyak himpunan data bahasa Indonesia. Akhirnya, rasa penasaran saya terjawab oleh salah satu kajian interdisplin linguistik yang bernama linguistik korpus.
Dalam KBBI V, korpus yang tergolong ranah linguistik didefinisikan sebagai ‘kumpulan ujaran yang tertulis atau lisan yang digunakan untuk menyokong atau menguji hipotesis tentang struktur bahasa’. Dalam kajian linguistik, penggunaan korpus itu sendiri lebih menitikberatkan pada bukti pemakaian bahasa (linguistic evidence). Hal itu tersebab teks yang dikumpulkan sebagai korpus merupakan teks alami yang tidak dibuat-buat. Teks alami tersebut, antara lain, berupa berita, novel, jurnal, dan tulisan blog. Nah, sangat besar kemungkinan bahwa teks yang Kerabat Nara hasilkan menjadi korpus bahasa kita, lo.
Pada umumnya, korpus diklasifikasikan menjadi empat, yaitu korpus umum, korpus khusus, korpus tetap, dan korpus dinamis. Mari kita telaah satu per satu.
Korpus Umum
Korpus ini dibuat untuk penelitian linguistik umum. Teks yang dimasukkan sebagai data pun disaring agar ada perimbangan secara proposional. Korpus umum cenderung berukuran besar dan kerap disebut sebagai korpus inti. Contoh korpus umum adalah British National Corpus (BNC) atau Bank of English yang menggambarkan variasi bahasa secara keseluruhan.
Korpus Khusus
Korpus ini dibuat untuk penelitian linguistik bertopik tertentu dalam kurun waktu yang tertentu pula. Misal, korpus penelitian yang bertujuan membandingkan gaya bahasa jurnalistik antara Kompas dan Tempo pada 2021. Korpus khusus cenderung berukuran kecil.
Korpus Tetap
Sama seperti korpus khusus, korpus tetap ini juga dibuat untuk penelitian linguistik khusus. Yang membedakannya dengan korpus khusus ialah komposisi dan besarannya yang bersifat tetap. Isi korpus tetap tidak akan mengalami perubahan dari waktu ke waktu.
Korpus Dinamis
Seperti namanya, korpus dinamis ini akan selalu bertambah dari masa ke masa. Baik dari segi ukuran maupun dari segi komposisi, korpus dinamis akan selalu berubah. Korpus dinamis kerap disebut sebagai korpus rujukan. Kegunaan utamanya ialah memonitor perkembangan bahasa kontemporer.
Setelah mengetahui empat jenis korpus di atas, menurut Kerabat Nara, korpus yang berisi himpunan data kebahasaan Indonesia tergolong korpus apa? Jawab di kolom komentar, ya, Kerabat Nara.
Referensi: Kushartanti, dkk. 2009. Pesona Bahasa. Jakarta: Gramedia Pustaka Utama
Penulis: Dessy Irawan
Penyunting: Ivan Lanin
Bagaimana tanggapan Kerabat Nara?
Tinggalkan Balasan Batalkan balasan
Artikel & Berita Terbaru
- Keterampilan yang Dibutuhkan Penulis Wara
- Empat Unsur Gramatika sebagai Kunci Kemampuan Menata Tulisan
- Bahan Pertimbangan sebelum Mengirim Artikel ke Jurnal
- Bjir dan Bjrot
- Penulisan Infografik yang Mencakup Semua Hal
- Berbahasa Indonesia, Sulit atau Mudah?
- Pola Frasa dalam Bahasa Kita
- Kelas Perdana Penulisan Skenario dalam Produksi Video
- Penulisan Mikrokopi UX yang Ramah Pengguna
- Kiat Penyusunan Dokumen untuk Konsultan Proxsis
- Penyunting yang Tak Sama dengan Penguji Baca
- Mengenal Penulisan Artikel dan Esai Lebih Dalam