KRIS.WEB.ID – Sebuah laporan terbaru menyoroti kelemahan signifikan pada fitur integrasi ChatGPT dengan Apple Health. Fitur ini diuji oleh seorang reporter The Washington Post menggunakan data kesehatan pribadinya. Hasil pengujian menunjukkan akurasi yang mengkhawatirkan dan inkonsistensi dalam penilaian.
OpenAI sebelumnya telah mengumumkan peluncuran ChatGPT Health. Ini adalah bagian khusus dari ChatGPT yang memungkinkan pengguna bertanya seputar kesehatan. Untuk respons yang lebih personal, pengguna dapat menghubungkan berbagai layanan data kesehatan. Layanan tersebut meliputi Apple Health, MyFitnessPal, Weight Watchers, AllTrails, Instacart, dan Peloton.
ChatGPT Health juga mampu berintegrasi dengan catatan medis pengguna. Hal ini memungkinkan sistem menganalisis hasil lab dan riwayat medis lain. Tujuannya adalah untuk memberikan jawaban yang lebih terinformasi terkait pertanyaan kesehatan.
Reporter Geoffrey Fowler memberikan akses ChatGPT Health ke data Apple Watch-nya selama sepuluh tahun. Data ini mencakup 29 juta langkah dan 6 juta pengukuran detak jantung. Ia kemudian meminta bot untuk menilai kesehatan jantungnya.
Secara mengejutkan, ChatGPT memberikan nilai ‘F’ untuk kesehatan jantung Fowler. Merasa cemas, Fowler segera berkonsultasi dengan dokter pribadinya. Dokternya dengan tegas menepis penilaian AI tersebut.
Dokter Fowler menyatakan bahwa risiko masalah jantungnya sangat rendah. Bahkan, asuransinya kemungkinan tidak akan menanggung tes tambahan. Ini menunjukkan temuan chatbot tidak berdasar.
Kardiolog Eric Topol dari Scripps Research Institute juga tidak terkesan dengan penilaian model bahasa besar ini. Topol menyebut analisis ChatGPT sebagai ‘tidak berdasar’. Ia menyarankan masyarakat untuk mengabaikan saran medis dari AI, karena belum siap.
Salah satu temuan paling mengganggu adalah inkonsistensi ChatGPT. Ketika Fowler menanyakan pertanyaan yang sama beberapa kali, skor yang diberikan berfluktuasi. Penilaian berubah secara liar antara ‘F’ dan ‘B’.
Selain itu, ChatGPT juga terus melupakan informasi dasar tentang Fowler. Ini termasuk jenis kelamin dan usianya, meskipun memiliki akses penuh ke rekam medisnya.
Chatbot Claude milik Anthropic menunjukkan kinerja yang sedikit lebih baik. Claude memberikan nilai ‘C’ untuk kesehatan jantung Fowler. Namun, chatbot ini juga gagal memperhitungkan keterbatasan data dari Apple Watch.
Kedua perusahaan AI tersebut menyatakan bahwa alat kesehatan mereka tidak dimaksudkan untuk menggantikan dokter. Mereka juga tidak bertujuan untuk memberikan diagnosis medis. Topol berargumen, jika bot tidak dapat menilai data kesehatan dengan akurat, seharusnya mereka tidak menawarkan penilaian sama sekali.
Food and Drug Administration (FDA) Amerika Serikat telah menyatakan perannya sebagai regulator. FDA ingin mendorong inovasi teknologi. Namun, mereka menarik garis merah pada klaim medis atau klinis oleh AI tanpa tinjauan. ChatGPT dan Claude berdalih bahwa mereka hanya menyediakan informasi.
Topol memperingatkan bahwa penilaian yang salah dapat membuat orang cemas berlebihan tentang kesehatan mereka. Di sisi lain, hal ini juga bisa memberikan rasa aman palsu bagi orang yang sebenarnya memiliki masalah kesehatan. Potensi dampaknya sangat besar.
Integrasi Apple Health ChatGPT saat ini masih terbatas pada sekelompok pengguna beta. Menanggapi laporan ini, OpenAI menyatakan sedang berupaya meningkatkan konsistensi respons chatbot. Wakil Presiden OpenAI, Ashley Alexander, menjelaskan bahwa akses terbatas ini memungkinkan mereka untuk belajar dan memperbaiki pengalaman. Tujuannya adalah sebelum fitur tersebut tersedia secara luas. Informasi ini dilansir dari MacRumors.