Pada uji AIME-24 (soal kompetisi matematika internasional), MiMo-7B-RL, versi terbaik dari model ini, mencatat skor 68,2 persen, lebih tinggi dibanding o1-mini (63,6 persen) dan Qwen-32B (50 persen). Sementara di benchmark LiveCodeBench V5 untuk pengujian coding, MiMo-7B-RL mencatat 57,8 persen, juga melampaui o1-mini (53,8 persen) dan Qwen-32B (41,9 persen).
Namun, di sejumlah pengujian lain seperti DROP, MMLU-Pro, dan GPQA, performa MiMo-7B masih berada di angka rata-rata 50 persen, menunjukkan ruang peningkatan yang masih terbuka lebar.
Empat Versi, Gratis Diakses Publik
Xiaomi merilis MiMo-7B dalam empat varian yang bisa diakses secara gratis:
-
MiMo-7B-Base: Model dasar, belum mengalami fine-tuning.
-
MiMo-7B-SFT: Versi dengan pelatihan tambahan berbasis data.
-
MiMo-7B-RL-Zero: Versi awal dari proses fine-tuning dengan reinforcement learning.
-
MiMo-7B-RL: Versi paling mumpuni dan siap digunakan secara luas.
Langkah Xiaomi membuka akses publik ini menunjukkan ambisinya untuk mempercepat adopsi AI sambil mengumpulkan masukan dari pengguna global.
Tantangan dan Potensi di Masa Depan