Google Ungkap Pencapaian Besar AI Gemini di Bidang Matematika

Perusahaan teknologi Google sesumbar bahwa model kecerdasan buatan (AI) mereka, Gemini, berhasil menorehkan prestasi setara "juara" olimpiade matematika dunia.
Lewat mode khusus bernama Deep Think, Gemini disebut mampu menyelesaikan lima dari enam soal sulit yang diujikan dalam ajang International Mathematical Olympiad (IMO) 2025.
Sebagai informasi, IMO merupakan ajang kompetisi internasional matematika paling bergengsi di dunia yang telah diselenggarakan sejak tahun 1959.
Kompetisi ini mempertemukan pelajar pra-universitas terbaik dari berbagai negara, untuk memecahkan enam soal kompleks yang mencakup aljabar, kombinatorika, geometri, dan teori bilangan.
Nah, dalam kompetisi IMO 2025 yang digelar pertengahan Juli lalu, Google menyebut model AI Gemininya berhasil mencetak skor 35 poin dari total maksimum 42 poin (skor sempurna).
Skor ini setara dengan peraih medali emas IMO yang biasanya hanya diberikan ke sekitar 8 persen peserta terbaik.
Pakai mode Deep Think
Seperti disinggung di atas, dalam pengujian ini Google menggunakan mode Deep Think Gemini. Mode ini belum dirilis secara resmi dan baru diperkenalkan Google dalam ajang Google I/O 2025 lalu.
Deep Think sendiri merupakan “mode penalaran yang ditingkatkan” (enhanced reasoning mode). Mode ini yang mengadopsi “teknik penelitian terkini,” seperti pemikiran paralel (pararel thinking).
Lewat pengaturan tersebut, model AI diyakini mampu mengeksplorasi dan menggabungkan beberapa solusi sekaligus, sebelum menentukan jawaban akhir.
Pendekatan ini juga membuat model AI tidak terpaku pada satu pemikiran saja, melainkan bisa mengevaluasi banyak kemungkinan jawaban secara bersamaan.
Dalam kompetisi IMO, mode Deep Think Gemini dilatih secara khusus supaya dapat menyelesaikan persoalan kompleks dan teknis di soal-soal IMO.
Guna mendukung kemampuannya, Google melatih mode Deep Think Gemini menggunakan teknik pembelajaran penguatan (reinforcement learning) terbaru.
Teknik reinforcement learning ini memungkinkan Gemini memanfaatkan lebih banyak data soal penalaran bertingkat, pemecahan masalah, dan pembuktian teorema secara lebih dalam.
Selain itu, Google juga memberi model AI Gemini akses ke "corpus" atau kumpulan solusi matematika berkualitas tinggi yang dilengkapi dengan petunjuk dalam menyelesaikan soal IMO.
Dengan serangkaian dukungan inilah yang kemudian mampu membuat mode Deep Think di Gemini AI menyelesaikan lima dari enam soal kompleks IMO, dalam waktu 4,5 jam (setara durasi resmi kompetisi).
Bukti peningkatan model AI sebelumnya
Pada tahun 2024, Google pernah melakukan uji coba yang sama terhadap model AI miliknya yang bernama Google DeepMind. Lewat mode AlphaGeometry dan AlphaProof, Google DeepMind hanya mampu memecahkan empat dari enam soal IMO 2024. Skor totalnya yaitu 28 poin atau setara dengan medali perak. Sedangkan di IMO 2025, lewat mode Deep Think yang ditingkatkan, AI Gemini mampu menjawab lima dari enam soal IMO, dengan total skor 35 poin dan meraih medali emas.
Klaim Google terhadap keunggulan Gemini dalam mode Deep Think menjadi bukti peningkatan signifikan dibanding model-model AI Google sebelumnya.
Sebab, pada tahun 2024, Google juga pernah melakukan uji coba yang sama terhadap model AI miliknya yang bernama Google DeepMind.
Lewat mode AlphaGeometry dan AlphaProof, Google DeepMind hanya mampu memecahkan empat dari enam soal IMO. Skor totalnya yaitu 28 poin atau setara dengan medali perak.
Untuk menyelesaikan soal IMO, model AI tersebut bahkan dilaporkan memakan waktu komputasi dua sampai tiga hari. Berbeda dengan model AI Gemini yang hanya 4,5 jam.
Hal ini dapat terjadi karena saat itu, model AI AlphaGeometry dan AlphaProof harus menerjemahkan terlebih dahulu bahasa alami (natural language) ke bahasa pemrograman khusus (domain-specific language).
Berbeda dengan Deep Think Gemini yang pada tahun ini, dirancang agar mampu memproses soal-soal IMO dalam bahasa alami secara langsung. Sehingga, proses pemecahan soalnya bisa lebih cepat dan efisien.
Dengan perbandingan tersebut, kompetisi IMO dianggap sebagai ajang yang tepat untuk menguji kemampuan pemecahan masalah dan penalaran matematika tingkat lanjut, dari model AI Google.
Diuji coba terbatas untuk matematikawan
Dihimpun KompasTekno dari 9to5google, Rabu (23/7/2025), Google mengatakan bahwa mode Deep Think Gemini akan dilakukan uji coba terbatas, termasuk para ahli matematika (matematikawan).
Setelah tahap uji coba selesai, Deep Think direncanakan akan tersedia di Google AI Ultra. Namun, belum ada kepastian kapan fitur ini akan tersedia untuk publik, termasuk pengguna dengan paket berlangganan 250 dollar AS per bulan (sekitar Rp 4 jutan).