Dalam fonologi, kita mengenal istilah diftong dan deret vokal untuk menjelaskan pelafalan vokal serta gugus konsonan dan deret konsonan untuk menjelaskan pelafalan konsonan. Pelafalan tersebut membedakan cara kita mengucapkan vokal dan konsonan dalam situasi kebahasaan tertentu. Umumnya, masyarakat Indonesia sudah memiliki kepekaan linguistik yang mampu membedakan pelafalan bunyi dalam suatu ujaran. Akan tetapi, tidak banyak yang mampu menjelaskan secara terperinci bagaimana bunyi bahasa itu dikonstruksi.
Dari paparan di atas, kita kemudian bisa menyimpulkan bahwa konsep diftong dan deret vokal setara dengan konsep gugus konsonan dan deret konsonan. Kedua konsep tersebut menjelaskan pelafalan bunyi bahasa berdasarkan konstruksi kebahasaannya. Misalnya, deret vokal dalam bahasa Indonesia merupakan dua vokal yang masing-masing mempunyai satu embusan napas, seperti vokal /iu/ dalam /tiup/ dan /ao/ dalam /aorta/. Sementara itu, deret konsonan merupakan dua konsonan atau lebih yang berasal dari suku kata terpisah yang berdekatan, misalnya /ht/ dalam /səjahtəra/ dan /ls/ pada /palsu/.
Lalu, mengapa kita menyebut dua huruf yang melambangkan satu bunyi vokal sebagai diftong dan bukannya gugus vokal, sedangkan dua konsonan atau lebih yang termasuk dalam suku kata yang sama disebut gugus konsonan?
Secara umum, gugus vokal disamakan dengan diftong, yakni bunyi yang dihasilkan ketika dua vokal berada pada satu silabel (suku kata). Sementara itu, gugus konsonan dikenal dengan istilah klaster.
Penggunaan istilah diftong, alih-alih gugus vokal, kemungkinan besar bertujuan untuk menjelaskan perbedaan bunyi vokal, seperti diftong, monoftong, diftongisasi, dan monoftongisasi. Sementara itu, untuk konsonan, perbedaan bunyinya diidentifikasi dengan kondisi alat ucap, seperti frikatif, glotal, dan alveolar. Jadi, perbandingan antara diftong dan gugus konsonan tidak digunakan untuk menjelaskan perbedaan antara konsonan dan vokal, tetapi justru menjelaskan pembentukan bunyi masing-masing.
Diftong merupakan bentuk akhir dari diftongisasi, yakni perubahan bunyi vokal tunggal (monoftong) menjadi dua bunyi vokal atau justru vokal rangkap secara berurutan. Misalnya, /aŋgota/ kerap dilafalkan dengan [aŋgauta] dan /sentosa/ kerap dilafalkan dengan [sentausa]. Perubahan bunyi itu terjadi pada bunyi vokal /o/ menjadi vokal rangkap /au/ karena ada analogi penutur dalam rangka memurnikan bunyi pada kata tersebut. Hal itu juga yang kemudian banyak mendasari penelitian linguistik tentang sifat fungsional fonem yang justru membedakan kemampuan fonem menjadi vokal, diftong, dan konsonan (Soedjarwo, dkk., 1985: 49; Setyadi dan Wasisto, 2018: 27).
Pelafalan vokal, misalnya, menunjukkan bahwa vokal yang berdampingan tidak melulu menghasilkan pelafalan yang luruh atau menyatu. Hal itu mungkin definisi dari “tidak berjodoh”. Berdasarkan itu, mungkinkah kita bisa mengganti istilah “tidak berjodoh” dengan “tidak berdiftong”?
Referensi:
Mainora, Leni. 2018. “Analisis Perubahan Bunyi Bahasa dalam Esai Pemelajar BIPA Timor Leste”. Seminar Internasional Kebahasaan 2019, hlm. 77–92. Badan Pengembangan dan Pembinaan Bahasa.
Setyadi, Ary dan Djoko Wasisto. 2018. “Sifat Fungsional dan Manfaat ‘Pasangan Minimal’ Fonem dalam Pembelajaran Fonologi Bahasa Indonesia”. Laporan Penelitian Fakultas Ilmu Budaya, Universitas Diponegoro, Semarang.
Soedjarwo, dkk. 1985. “Perbandingan Tata Bunyi Bahasa Indonesia dan Bahasa Jawa”. Laporan Penelitian Departemen Pendidikan Semarang.
Penulis : Innezdhe Ayang Marhaeni
Penyunting : Harrits Rizqi