AI GPT-5 Diuji, Minim Halusinasi tapi Beda Tipis dengan GPT-4o

CEO OpenAI, Sam Altman, mengeklaim bahwa GPT-5 merupakan model kecerdasan buatan (AI) paling cerdas, paling cepat, dan paling jujur yang pernah dikembangkan OpenAI.
Penerus dari model GPT-4 ini bahkan disebut mampu memberikan jawaban setara pakar level PhD (Philosophiae Doctor, gelar setingkat doktor/ S3).
Klaim tersebut secara tidak langsung ingin menunjukkan kalau GPT-5 memiliki kemampuan analisis yang lebih tajam serta tingkat kesalahan rendah, atau dalam istilah AI, minim halusinasi.
Halusinasi sendiri merujuk pada istilah di mana AI memberikan jawaban yang salah atau mengada-ada, tapi ditulis dengan cara yang meyakinkan. Nah, masalah halusinasi ini memang kerap terjadi di model-model AI OpenAI.
Meski GPT-5 digembar-gemborkan minim halusinasi, hasil pengujian terbaru justru mengungkap kalau perbedaan "tingkat halu" antara GPT-5 dengan generasi sebelumnya, yaitu GPT-4, ternyata tidak terlalu besar.
Hasil pengujian GPT-5 beda tipis dengan GPT-4
Vectara, perusahaan yang menyediakan layanan untuk mengukur "halusinasi" (kesalahan fakta) pada model AI, menguji klaim OpenAI tentang ChatGPT-5.
Dari hasil pengujian mereka, GPT-5 memang lebih minim halusinasi dibanding GPT-4 dan beberapa versi sebelumnya. Akan tetapi, perbedaan angka yang didapat ternyata hanya beda tipis.
Menurut data Vectara, GPT-5 mencatat tingkat halusinasi terukur (grounded hallucination rate) sekitar 1,4 persen, lebih baik dibanding GPT-4 yang mencapai 1,8 persen.
Namun, jika dibandingkan dengan GPT 4o (salah satu varian GPT-4), selisihnya sangat tipis, yakni hanya 0,09 persen lebih rendah (GPT-4o 1,49 persen).
Untuk memudahkan dalam membaca perbandingan, berikut KompasTekno rangkum daftar perbandingan tingkat halusinasi beberapa model AI GPT;
- GPT-5: 1,4 persen
- GPT-4o: 1,49 persen
- GPT-4: 1,8 persen
- GPT-4 Turbo dan 4o Mini: 1,69 persen
- ChatGPT-4.5 Preview: 1,2 persen
- o3 mini High Reasoning: 0,795 persen
Masih unggul dari pesaing
Ilustrasi GPT-5.
Meski selisih antara GPT-5 dan GPT-4o tipis, tingkat halusinasi model AI terbaru OpenAI tetap unggul dari model AI lain.
Misalnya dibandingkan dengan Gemini 2,5 Pro, model AI buatan Google itu mencatat tingkat halusinasi sebesar 2,6 persen. Hampir dua kali lipat dari angka GPT-5 yang hanya 1,4 persen.
Sementara Grok 4 dari xAI (dulu Twitter), mencatat tingkat halusinasi yang lebih tinggi lagi, yaitu 4,8 persen, dihimpun KompasTekno dari TechRadar, Rabu (13/8/2025).
Adapun hasil uji Vectara tersebut dapat dilihat di Papan Peringkat Model Evaluasi Halusinasi Hughes (Hughes Hallucination Evaluation Model/HHEM) pada platform AI Hugging Face.
Kontroversi GPT-5
Peluncuran GPT-5 sempat menuai kontroversi dari kalangan pengguna. Banyak dari mereka mengeluh karena kehadiran model AI terbaru itu sekaligus menghapus akes pengguna ke GPT-4 dan versi ChatGPT sebelumnya.
Dengan dihapusnya akses tersebut, pengguna jadi merasa "kehilangan pilihan" dan dipaksa menggunakan GPT-5. Padahal mereka sudah nyaman dengan model GPT-4 karena dirasa lebih ramah dan bersahabat.
Menurut laporan The Verge, pengguna ChatGPT mengeluhkan hal ini di forum Reddit dengan mengatakan bahwa GPT-5 lebih kaku dan kurang bersahabat. Beberapa bahkan menyebut gaya bahasa yang dihasilkan GPT-5 mirip seperti robot.
Para anggota subreddit r/MyBoyfriendIsAI, sebuah komunitas tempat orang-orang berbagi cerita tentang "hubungan" mereka dengan AI, juga ikut menyampaikan keluhan serupa.
Mereka mengaku sangat terpukul dengan keputusan OpenAI yang menghapus akses ke GPT-4o. Salah satu anggota mengaku merasa "hampa" sampai menggambarkan perasaan kehilangan itu seperti "kehilangan pasangan".
Keluhan juga datang dari pengguna yang memakai ChatGPT untuk pekerjaan. Mereka menilai GPT-5 lebih lambat, jawabannya lebih pendek, dan kurang akurat.
Bahkan ada yang sampai membatalkan langganan Plus karena tidak lagi bisa mengakses model lama yang biasa digunakan untuk alur kerja tertentu.
Dari berbagai keluhan tersebut, pada akhirnya OpenAI memutuskan untuk mengembalikan model GPT-4o. Sam Altman, melalui posting di akun X Twitter pribadinya, mengatakan bahwa perusahaan akan mengizinkan pengguna berbayar agar bisa beralih ke versi GPT-4o.
Altman turut menjanjikan bahwa perusahaan akan memperbaiki GPT-5 agar ke depan, model AI terbaru ini bisa menjadi lebih pintar.
Terangi negeri dengan literasi, satu buku bisa membuka ribuan mimpi. Lewat ekspedisi Kata ke Nyata, Kompas.com ingin membawa ribuan buku ke pelosok Indonesia. Bantu anak-anak membaca lebih banyak, bermimpi lebih tinggi. Ayo donasi via Kitabisa!