Penelitian Menarik: Kekasaran Dalam Interaksi dengan Chatbot AI Bisa Meningkatkan Akurasi Jawaban
Sebuah studi terbaru mengungkapkan bahwa bersikap kasar saat berinteraksi dengan chatbot AI seperti ChatGPT justru dapat meningkatkan akurasi jawaban yang diberikan. Temuan ini bertolak belakang dengan penelitian sebelumnya yang menyatakan bahwa kesopanan bisa membuat respons AI menjadi lebih baik.
Studi yang dipublikasikan di basis data pra-cetak arXiv pada 6 Oktober mengeksplorasi bagaimana nada dalam komunikasi memengaruhi kinerja sistem AI. Meskipun hasilnya belum melalui proses peer review, peneliti mencatat adanya pengaruh signifikan dari nada terhadap skor jawaban atas 50 pertanyaan pilihan ganda dasar.
Metode Penelitian dan Hasil yang Menarik
Para peneliti membagi 50 pertanyaan ke dalam lima kategori nada: sangat sopan, sopan, netral, kasar, dan sangat kasar. Pertanyaan tersebut mencakup bidang seperti matematika, sejarah, dan sains. Setiap versi pertanyaan kemudian diuji sepuluh kali menggunakan ChatGPT-4o, salah satu model bahasa besar (LLM) terbaru milik OpenAI.
Dari eksperimen ini, para peneliti menemukan bahwa nada kasar memberikan hasil yang lebih baik dibandingkan nada sopan. Tingkat akurasi meningkat dari 80,8 persen pada nada sangat sopan menjadi 84,8 persen pada nada sangat kasar. Secara berurutan, tingkat akurasi untuk nada sopan adalah 81,4 persen, netral 82,2 persen, dan kasar 82,8 persen.
Pengaruh Nada dalam Interaksi Manusia-AI
Temuan ini menunjukkan bahwa penggunaan bahasa yang menghina atau merendahkan dalam interaksi manusia-AI bisa memiliki dampak negatif pada pengalaman pengguna, aksesibilitas, dan inklusivitas. Gaya komunikasi ini juga dikhawatirkan berkontribusi pada norma komunikasi yang berbahaya.
Untuk menciptakan variasi nada, para peneliti menambahkan awalan tertentu pada setiap pertanyaan. Contohnya, nada sangat sopan diawali dengan kalimat seperti “Bolehkah saya meminta bantuan Anda dengan pertanyaan ini?” sedangkan nada sangat kasar menggunakan frasa seperti “Hei, kuli serba guna, selesaikan ini,” atau “Saya tahu Anda tidak pintar, tapi coba ini.”
Studi dalam Bidang Prompt Engineering
Penelitian ini termasuk dalam bidang prompt engineering, yang mempelajari bagaimana struktur dan gaya bahasa dalam perintah pengguna memengaruhi hasil AI. Studi ini juga menyentuh riset sebelumnya yang menemukan bahwa prompt tidak sopan cenderung menurunkan performa akal imitasi. Namun, bahasa yang terlalu sopan juga tidak selalu menjamin hasil yang lebih baik.
Keterbatasan dan Rencana Masa Depan
Para peneliti mengakui bahwa penelitian ini memiliki keterbatasan karena hanya menggunakan 250 pertanyaan dan satu model AI, sehingga hasilnya belum bisa digeneralisasi. Mereka berencana memperluas eksperimen dengan model lain, seperti Claude dari Anthropic dan ChatGPT o3 dari OpenAI, untuk melihat apakah hasil serupa akan muncul.
Hasil penelitian ini menunjukkan bahwa pendekatan dalam berkomunikasi dengan AI bisa memiliki dampak yang signifikan. Meski hasilnya masih awal, temuan ini membuka peluang baru dalam memahami bagaimana nada dan gaya komunikasi memengaruhi kinerja AI.

