OpenAI, perusahaan teknologi yang dikenal lewat chatbot andalan mereka, ChatGPT, kembali menghadirkan inovasi baru di dunia kecerdasan buatan (AI). Kali ini, mereka mengumumkan peluncuran dua model terbaru, yaitu o3 dan o3-mini. Model-model ini dirancang untuk menjadi solusi yang lebih canggih dalam menyelesaikan berbagai persoalan rumit, terutama di bidang matematika dan penalaran logis.
Nama o3 tentu bukan sekadar angka. Model ini merupakan penerus dari model o1 yang dirilis pada September lalu. Dalam ekosistem AI reasoning milik OpenAI, o1 telah menjadi tonggak awal untuk menunjukkan bahwa AI tidak hanya mampu memberikan jawaban, tetapi juga bisa berpikir logis. Kini, dengan hadirnya o3, OpenAI menjanjikan peningkatan signifikan dalam kemampuan reasoning.
Sementara itu, o3-mini adalah versi lebih ringan dan hemat sumber daya dari o3. Model ini juga menjadi pengganti dari o1-mini, yang sebelumnya telah mendapatkan sambutan baik dari pengguna karena kemampuannya yang efisien. Dengan demikian, pengguna memiliki pilihan model sesuai kebutuhan: o3 untuk performa maksimal dan o3-mini untuk solusi yang lebih terjangkau.
Salah satu fitur unggulan dari o3 adalah kemampuannya menyelesaikan soal-soal matematika tingkat tinggi. Dalam pengujian internal, o3 berhasil menunjukkan performa luar biasa di American Invitational Mathematics Exam (AIME) 2024, sebuah kompetisi matematika internasional yang dikenal dengan tingkat kesulitannya yang ekstrem. Hasilnya, o3 mampu menyelesaikan hampir semua soal dengan akurasi mencapai 96,7 persen. Model ini hanya membuat satu kesalahan, menjadikannya sebagai salah satu AI paling andal di kelasnya.
Sebagai perbandingan, pendahulunya, o1, hanya mencapai skor 83,3 persen pada pengujian serupa. Perbedaan ini menunjukkan lompatan besar dalam pengembangan kemampuan reasoning oleh OpenAI. Tidak hanya itu, versi ringan, o3-mini, juga menunjukkan kinerja yang mengesankan. Dalam mode reasoning “High,” o3-mini mendapatkan skor 83,6 persen, jauh melampaui o1-mini yang hanya meraih 63,6 persen.
Kemampuan o3 tidak terbatas pada matematika. Model ini juga diuji pada soal-soal sains tingkat universitas yang tergabung dalam kelompok soal GPQA Diamond. Hasilnya? Skor 87,7 persen berhasil diraih oleh o3, membuktikan keandalannya dalam menjawab berbagai persoalan kompleks lintas disiplin ilmu.
Tidak berhenti di situ, o3 juga unggul dalam beberapa benchmark reasoning populer, seperti:
Satu lagi pengujian menarik adalah ARC-AGI, yang biasanya digunakan untuk mengukur sejauh mana AI memiliki pola pikir menyerupai manusia. Pada pengujian ini, o3 mencatatkan skor 76 persen dalam mode “Low” dan 88 persen dalam mode “High.” Sebagai perbandingan, o1 hanya mencapai skor 20-30 persen di berbagai mode. Hasil ini menjadikan o3 sebagai salah satu kandidat terkuat dalam pengembangan kecerdasan buatan umum atau Artificial General Intelligence (AGI).
Meski memiliki kemampuan reasoning yang luar biasa, o3 bukan tanpa kelemahan. Salah satu tantangan utamanya adalah waktu respons yang lebih lama dibandingkan model AI lainnya. Hal ini dikarenakan proses reasoning membutuhkan perhitungan yang lebih kompleks. Dalam mode “High,” o3 membutuhkan waktu sekitar 23 detik untuk memberikan jawaban setelah menerima pertanyaan. Sebagai perbandingan, GPT-4o, model AI reguler dari OpenAI, hanya membutuhkan waktu 0,5 detik untuk merespons.
Namun, jika diatur dalam mode “Low,” o3 dapat merespons dalam waktu sekitar 1 detik. Sayangnya, kecepatan ini datang dengan kompromi pada tingkat akurasi. Oleh karena itu, pengguna disarankan untuk memilih mode sesuai dengan kebutuhan: mode High untuk persoalan yang membutuhkan ketelitian tinggi dan mode Low untuk respons yang lebih cepat.
Dengan karakteristik seperti ini, o3 dan o3-mini lebih cocok digunakan untuk menyelesaikan persoalan matematika atau sains yang membutuhkan penalaran mendalam. Jika pengguna membutuhkan jawaban cepat untuk pertanyaan umum, maka GPT-4o tetap menjadi pilihan yang lebih efisien.
Saat ini, o3 dan o3-mini masih berada dalam tahap uji coba. OpenAI membuka kesempatan bagi pengguna untuk mencoba versi awal kedua model ini. Pendaftaran uji coba dibuka hingga 10 Januari 2025. Bagi yang berminat, ini adalah kesempatan emas untuk merasakan langsung kecanggihan model reasoning terbaru dari OpenAI.
OpenAI sendiri belum memberikan tanggal pasti untuk peluncuran resmi kedua model ini di platform ChatGPT. Namun, mereka telah mengumumkan bahwa o3-mini direncanakan meluncur pada akhir Januari 2025, disusul oleh o3 beberapa waktu kemudian. Dengan begitu, pengguna dapat menantikan pengalaman baru dalam memanfaatkan AI untuk menyelesaikan persoalan kompleks.
Peluncuran o3 dan o3-mini menunjukkan arah baru dalam pengembangan kecerdasan buatan. Alih-alih hanya fokus pada kecepatan atau jumlah data yang dapat diproses, OpenAI kini berusaha mengasah kemampuan reasoning, sehingga AI dapat benar-benar berpikir seperti manusia. Langkah ini tidak hanya relevan untuk bidang pendidikan dan penelitian, tetapi juga membuka peluang baru dalam penerapan AI di industri yang membutuhkan solusi cerdas.
Dari menyelesaikan soal matematika tingkat tinggi hingga menguasai bidang sains dan coding, o3 adalah bukti nyata bahwa AI semakin mendekati kemampuan manusia dalam berpikir dan bernalar. Dengan perkembangan ini, tidak diragukan lagi bahwa kecerdasan buatan akan menjadi alat yang semakin esensial di berbagai aspek kehidupan.
Bagi Anda yang penasaran, jangan lewatkan kesempatan untuk mencoba o3 dan o3-mini. Siapa tahu, Anda bisa menjadi saksi awal dari evolusi AI menuju kecerdasan buatan yang benar-benar revolusioner.