Voice Engine, AI yang Bisa Tiru Suara Manusia dengan Akurasi Nyaris Sempurna
TEKNOLOGI DIGITAL
Apr 02 2024, 05.54
OpenAI telah meluncurkan alat kecerdasan buatan baru yang dapat menirukan suara manusia dengan akurasi yang hampir sempurna. Generator suara AI ini memiliki berbagai aplikasi potensial, termasuk untuk layanan aksesibilitas.
OpenAI membagikan sampel dari tes awal alat tersebut, yang disebut Voice Engine, yang menggunakan sampel 15 detik dari seseorang yang berbicara untuk menghasilkan replika suara mereka. Pengguna kemudian dapat memberikan paragraf teks dan alat ini akan membacanya dengan suara yang dihasilkan oleh AI.
Ada beberapa layanan suara yang dihasilkan AI yang sudah tersedia untuk umum. Alat teks ke suara berkemampuan AI dapat membantu penerjemahan, bantuan membaca untuk anak-anak, atau membantu orang yang kehilangan kemampuan berbicara, kata perusahaan.
OpenAI mengatakan Voice Engine saat ini hanya digunakan oleh sekelompok kecil mitra tepercaya termasuk perusahaan teknologi pendidikan dan Kesehatan.
OpenAI juga akan melakukan pengujian untuk menentukan apakah dan bagaimana mengizinkan penggunaan Voice Engine secara lebih luas. Para penguji tersebut telah setuju untuk tidak membuat ulang suara orang tanpa persetujuan eksplisit dari mereka dan dengan jelas mengidentifikasi kepada pendengar bahwa apa yang mereka dengar adalah suara yang dihasilkan oleh AI.
"Kami menyadari bahwa menghasilkan ucapan yang menyerupai suara orang memiliki risiko serius, yang terutama menjadi perhatian utama di tahun pemilihan umum," kata OpenAI dalam sebuah posting blog dilansir dari laman CNN.
Perusahaan mengakui perlunya perubahan besar karena audio yang dihasilkan AI menjadi lebih banyak tersedia, meskipun mereka tidak berencana untuk segera merilis Voice Engine ke publik. Sebagai contoh, perusahaan menyarankan untuk menghapus otentikasi berbasis suara untuk rekening bank secara bertahap.
"Setiap penyebaran teknologi suara sintetis secara luas harus disertai dengan pengalaman otentikasi suara yang memverifikasi bahwa pembicara asli secara sadar menambahkan suara mereka ke layanan dan daftar suara terlarang yang mendeteksi dan mencegah pembuatan suara yang terlalu mirip dengan tokoh-tokoh terkemuka," kata OpenAI.
Voice Engine dapat menggunakan sampel suara dalam satu bahasa untuk membuat suara replika yang dapat berbicara dalam berbagai bahasa lain. Pada setiap sampel yang dihasilkan AI, nada dan aksen pembicara asli dipertahankan.