Microsoft AI Rilis Model Kecerdasan Buatan Pertamanya, MAI-Voice-1

microsoft, model AI, MAI-Voice-1, Mai-1-preview, Microsoft AI Rilis Model Kecerdasan Buatan Pertamanya, MAI-Voice-1

Divisi kecerdasan buatan (AI) Microsoft mengumumkan model AI buatan sendiri pertamanya, MAI-Voice-1 AI dan MAI-1-preview.

Micorosft mengeklaim bahwa model suara MAI-Voice-1 barunya dapat menghasilkan satu menit audio dalam kurang dari satu detik menggunakan hanya satu GPU, sementara MAI-1-preview memberikan gambaran tentang "penawaran masa depan di dalam Copilot."

Langkah ini juga menjadi bagian dari visi Microsoft dalam membangun ekosistem AI yang lebih luas, mulai dari interaksi suara yang lebih natural hingga model bahasa generatif yang semakin canggih.

MAI-Voice-1: AI Suara Natural dan Ekspresif

MAI-Voice-1 merupakan model AI yang bisa membuat audio suara manusia (speech generation) pertama dari Microsoft AI.

Model ini diklaim mampu menghasilkan audio suara berkualitas tinggi dengan nada natural dan ekspresif, baik untuk percakapan tunggal (dongeng, monolog, meditasi, dll) maupun percakapan banyak orang (diskusi, berdebat, dll).

Microsoft mengeklai MAI-Voice-1 bisa membuat audio suara manusia berdurasi sekitar satu menit dengan waktu pembuatan sekitar satu detik setelah pengguna memasukkan perintah atau.

Pembuatan audio suara manusia ini diklaim hanya diproses dengan satu unit pengolah grafis (GPU) yang ada di server Microsoft. 

Dalam blog resmi Microsoft, mereka mendemonstrasikan dua hasil dari MAI-Voice-1, yaitu wanita berdongeng dan sekumpulan orang sedang berdiskusi dengan logat suara berbeda. 

Dongeng tersebut terdengar cukup natural dan seru, lantaran pendongeng menggunakan nada suara yang cukup ekspresif. Ia juga berkali-kali mengubah suaranya jadi suara binatang yang sedang diceritakan.

Sementara itu, sesi diskusi yang dihasilkan AI Microsoft ini juga terdengar menyenangkan dengan beberapa pembicara yang memiliki nada unik, luwes, dan pembawaan yang tidak monoton. 

Saat ini, Microsoft menyebut MAI-Voice-1 sudah digunakan di fitur Copilot Daily dan Podcasts, serta tersedia untuk diuji coba melalui Copilot Labs.

MAI-1-preview

microsoft, model AI, MAI-Voice-1, Mai-1-preview, Microsoft AI Rilis Model Kecerdasan Buatan Pertamanya, MAI-Voice-1

Ilustrasi Microsoft

Selain model suara, Microsoft juga memperkenalkan MAI-1-preview, sebuah foundation model atau model AI generatif yang punya banyak model AI "kecil".

Berbagai model AI kecil (sub-model AI) ini biasa disebut sebagai Mixture of Experts (MoE), dan tiap bagian dari MoE biasanya dirancang sudah "ahli" untuk meneliti dan merespons sesuatu di bidang atau topik berbeda.

Microsoft mengeklaim MoE dalam fondasi model AI mereka dilatih menggunakan sekitar 15.000 unit GPU Nvidia H100. 

Dalam prosesnya, MAI-1-preview akan menjadi model AI generatif yang dapat dipakai untuk berbagai penggunaan.

Di antaranya seperti, kebutuhan yang berbasis teks, instruksi atau pemecahan masalah sehari-hari, hingga percakapan natural untuk membicarakan suatu topik.

Saat ini, MAI-1-preview tengah diuji coba ke publik melalui platform LMArena untuk mendapatkan evaluasi dari komunitas.

Model AI generatif ini juga tersedia bagi penguji atau pengembang aplikasi secara terbatas melalui sistem software alias API.

Dalam beberapa minggu ke depan, model ini akan mulai diintegrasikan ke dalam Copilot untuk sejumlah skenario teks.

Masa depan fokus di AI

Ke depannya, Microsoft akan terus mengembangkan seluruh rencana dan produk yang dihasilkan MAI, terutama untuk membangun model AI yang bisa berjalan secara efisien di kebutuhan berbeda. 

Hal ini tentunya akan didukung dengan berbagai infrastruktur Microsoft, termasuk chip AI terbaru Nvidia Grace Blackwell (GB200) yang ditujukan untuk pelatihan AI, proses inference skala besar, dan High Performance Computing (HPC).

Dengan hardware mumpuni dalam infrastruktur mereka, MAI optimis bisa menghadirkan AI yang aman, personal, dan relevan untuk miliaran pengguna di seluruh dunia, sebagaimana dirangkum KompasTekno dari Microsoft, Jumat (29/8/2025).

Di masa yang akan datang, MAI juga terus membuka peluang kolaborasi, baik dengan tim internal maupun komunitas AI dan open source.

Hal ini guna memastikan produk-produk AI mereka tetap kompetitif dan dapat memberikan dampak positif kepada masyarakat luas.

Terangi negeri dengan literasi, satu buku bisa membuka ribuan mimpi. Lewat ekspedisi Kata ke Nyata, Kompas.com ingin membawa ribuan buku ke pelosok Indonesia. Bantu anak-anak membaca lebih banyak, bermimpi lebih tinggi. Ayo donasi via Kitabisa!