Chatbot yang digunakan dalam eksperimen ini meliputi model-model AI populer seperti ChatGPT, Command R+, dan Llama 3 yang dikembangkan oleh Meta. Hasilnya cukup mencengangkan: peserta yang menggunakan chatbot justru lebih sulit dalam mengenali gejala penyakit dengan akurat. Bahkan, mereka cenderung meremehkan kondisi medis yang sebenarnya serius.
Masalah utamanya terletak pada dua hal: kurangnya pemahaman pengguna dalam memberikan detail yang tepat, dan kemampuan chatbot yang belum bisa menyesuaikan diri dengan kompleksitas komunikasi manusia dalam konteks kesehatan. Mahdi menambahkan, “Seringkali, chatbot memberikan kombinasi antara nasihat yang benar dan yang keliru. Ini membingungkan, dan berpotensi membahayakan jika diambil sebagai keputusan akhir dalam penanganan masalah kesehatan.”
Penelitian ini menjadi alarm penting di tengah gencarnya perusahaan teknologi mengembangkan aplikasi berbasis AI untuk sektor kesehatan. Apple, misalnya, tengah menggarap sistem AI untuk memberi saran seputar pola hidup sehat—dari olahraga hingga tidur. Amazon tak ketinggalan dengan mengembangkan AI yang mampu menganalisis data medis dalam jumlah besar, sementara Microsoft fokus pada teknologi AI yang bisa membantu petugas medis dalam proses triase pasien.
Meski inovasi AI di bidang medis berkembang cepat, hingga saat ini belum ada jaminan bahwa teknologi tersebut cukup andal untuk digunakan secara luas dalam pengambilan keputusan medis. Bahkan, asosiasi tenaga kesehatan di Amerika Serikat secara tegas menyarankan agar dokter tidak mengandalkan chatbot untuk diagnosis atau penanganan pasien.
Mahdi menegaskan, “Kami mendorong agar setiap keputusan terkait kesehatan dibuat berdasarkan informasi dari sumber yang terpercaya, bukan dari chatbot yang belum terbukti efektivitasnya di dunia nyata. Penggunaan chatbot dalam bidang medis harus melalui serangkaian uji coba ketat sebelum diterapkan secara luas.”