Studi: AI Mampu Jawab 76 Persen Pertanyaan Kesehatan dengan Benar, tetapi Belum Bisa Gantikan Dokter
Penelitian terbaru menunjukkan AI seperti ChatGPT mampu menjawab 76 persen pertanyaan kesehatan dengan akurat. Namun, para peneliti mengingatkan AI belum layak digunakan untuk diagnosis mandiri.
JAKARTA – Kecerdasan buatan (AI) seperti ChatGPT dinilai mampu menjawab pertanyaan seputar kesehatan dengan tingkat akurasi rata-rata mencapai 76 persen. Meski hasil tersebut menunjukkan perkembangan signifikan, para peneliti mengingatkan masyarakat agar tidak menjadikan AI sebagai pengganti dokter atau alat untuk melakukan diagnosis penyakit secara mandiri.
Temuan tersebut berasal dari penelitian yang dipimpin oleh Amulya Yadav dari Penn State University dan akan dipresentasikan pada Association for Computing Machinery Conference on Fairness, Accountability and Transparency 2026 di Montreal, Kanada.
Dalam penelitian yang dirilis Juni 2026 itu, para peneliti mengumpulkan lebih dari 200 pertanyaan mengenai gejala penyakit dan masalah kesehatan yang kemudian diajukan kepada berbagai model AI, termasuk ChatGPT. Selanjutnya, sembilan dokter spesialis bersertifikat mengevaluasi setiap jawaban berdasarkan tingkat akurasi dan keandalannya.
Hasilnya, model bahasa besar atau Large Language Models (LLM) mencatat tingkat akurasi rata-rata sekitar 76 persen. Di antara seluruh AI yang diuji, ChatGPT memberikan performa terbaik.
Penelitian tersebut juga menunjukkan bahwa AI secara umum memberikan jawaban yang lebih baik dibandingkan mesin pencari tradisional seperti Google maupun Bing ketika menjawab pertanyaan kesehatan berbasis teks.
Meski demikian, Yadav mengaku tetap berhati-hati dalam menilai kemampuan AI.
"Saya cukup terkejut karena performanya sangat baik. Namun kita tetap harus sangat berhati-hati mempercayai apa pun yang dihasilkan model bahasa karena pada dasarnya sistem tersebut menghasilkan rangkaian token berdasarkan probabilitas," ujarnya.
AI masih lemah untuk kesehatan mental dan penyakit kulit
Penelitian juga menemukan bahwa AI belum konsisten dalam menjawab pertanyaan yang membutuhkan penilaian klinis lebih kompleks.
Topik mengenai kesehatan mental, penyakit kulit (dermatologi), dan penyakit dalam memperoleh skor akurasi yang lebih rendah dibandingkan bidang lainnya.
Menurut peneliti, pertanyaan dermatologi umumnya membutuhkan analisis gambar, sesuatu yang hingga kini masih menjadi kelemahan banyak model AI. Sementara itu, konsultasi kesehatan mental memerlukan pemahaman konteks, empati, dan pertimbangan klinis yang jauh lebih kompleks daripada sekadar mengolah teks.
Sebaliknya, AI menunjukkan performa terbaik ketika menjawab pertanyaan mengenai penyakit umum, gejala ringan, maupun informasi kesehatan yang bersifat rutin.
Berpotensi membantu masyarakat yang sulit mengakses dokter
Mengacu pada data World Health Organization, lebih dari 50 persen populasi dunia masih belum memiliki akses memadai terhadap layanan kesehatan.
Dalam kondisi tersebut, Yadav menilai AI dapat menjadi sumber informasi awal bagi masyarakat yang kesulitan menjangkau tenaga medis.
"Hal itu tentu bisa menjadi sesuatu yang sangat bermanfaat, terutama bagi separuh populasi dunia yang belum memiliki akses terhadap dokter," katanya.
Namun ia kembali menegaskan bahwa AI saat ini belum memiliki tingkat akurasi setara dokter sehingga masyarakat harus berhati-hati jika menggunakannya untuk mendiagnosis penyakit sendiri.
Semakin banyak orang mengandalkan AI
Penelitian ini muncul di tengah meningkatnya penggunaan AI sebagai sumber informasi kesehatan.
Survei terbaru Gallup menunjukkan hampir setengah warga Amerika Serikat kini memanfaatkan AI dalam pengambilan keputusan terkait kesehatan.
Sebagian besar responden menggunakan AI untuk memperoleh jawaban lebih cepat atau mencari informasi tambahan sebelum maupun sesudah berkonsultasi dengan dokter.
Namun, survei tersebut juga mengungkap fakta yang mengkhawatirkan. Sekitar 14 persen responden mengaku membatalkan kunjungan ke dokter setelah memperoleh informasi dari AI. Gallup memperkirakan angka tersebut setara dengan sekitar 14 juta orang di Amerika Serikat.
Alasan lainnya beragam, mulai dari biaya layanan kesehatan yang mahal, kesulitan membuat janji temu di luar jam kerja, hingga pengalaman merasa diabaikan oleh tenaga medis.
Yadav mengingatkan bahwa kemajuan AI seharusnya tidak dijadikan alasan untuk mengurangi peran dokter dalam pelayanan kesehatan.
"Yang menjadi perhatian saya adalah masyarakat yang sebenarnya memiliki akses terhadap layanan kesehatan. Apakah kita benar-benar ingin mengurangi kebutuhan terhadap dokter hanya karena AI mampu memberikan jawaban? Ada pepatah lama, hanya karena kita memiliki palu bukan berarti semua masalah adalah paku," ucapnya. (*)
Simak breaking news dan berita pilihan TIMES Indonesia langsung dari WhatsApp-mu!
Klik 👉 Channel TIMES Indonesia
Pastikan WhatsApp kamu sudah terpasang.


