Model AI OpenAI Sabet Medali Emas di Olimpiade Matematika

Model bahasa besar (large language model/LLM) penalaran (reasoning) terbaru OpenAI berhasil mendapatkan medali emas pada Olimpiade Matematika Internasional (IMO) 2025.
Model AI ini sebenarnya tak mendapatkan medali emas sungguhan. Namun, LLM tersebut berhasil menyelesaikan 5 dari 6 soal IMO 2025 dengan tipe soal, kondisi, dan persayaratan yang mirip seperti kompetisi nyata.
Sebagai hasilnya, model AI tersebut mendapatkan skor 35 poin dari 42 poin dan mendapatkan Gold Level Performance alias performa yang setara dengan peraih medali emas di IMO 2025.
Seorang peneliti AI di OpenAI, Alexander Wei mengatakan ini merupakan hasil yang cukup baik untuk model AI eksperimental mereka.
Sebab, tak semua partisipan IMO dapat menyelesaikan soal yang didapat. Di IMO 2025, hanya 67 peserta dari total 630 peserta yang dapat menyelesaikan soal-soal dengan baik dan membawa pulang medali emas di kompetisi tersebut.
Dalam sederet posting X, Wei juga menjelaskan bahwa penyelesaian soal IMO merupakan bukti bahwa LLM reasoning teranyar mereka bisa menyelesaikan masalah dengan pola pikir mirip manusia.
"Ini dikarenakan soal-soal di IMO tak hanya menuntut kemampuan menghitung yang lihai saja, melainkan juga proses berpikir kreatif, dan model AI reasoning kami bisa membuktikan ini," kata Wei.
"Selain itu, soal-soal di IMO juga biasanya membutuhkan penjelasan yang tak cukup satu halaman. Model AI kami telah menyusun jawaban dengan baik dan bisa dinilai dan diverifikasi tiga peraih medali IMO dengan jelas," imbuh Wei.
Belum ada informasi apakah model AI penalaran yang diuji coba OpenAI ini adalah untuk suksesor GPT-4, yaitu GPT-5 atau tidak. Wei hanya mengatakan bahwa mereka kini tengah bersiap meluncurkan GPT-5 ke publik dalam waktu dekat.
"Kami tak memiliki rencana untuk merilis LLM yang dapat medali emas IMO ini ke publik, lantaran ini hanya sebagai model AI eksperimental," jelas Wei.
"Namun, ini membuktikan bahwa AI semakin hari semakin pintar dan bisa menyelesaikan soal-soal olimpiade yang cukup rumit yang membutuhkan kemampuan berpikir cerdas," pungkas Wei, sebagaimana dikutip KompasTekno dari Engadget, Senin (21/7/2025).