Model Bahasa AI Google: Lebih 300 Bahasa Tersedia
Blog

Model Bahasa AI Google: Lebih 300 Bahasa Tersedia

Model Pertuturan Universal Google (USM) telah memperluaskan sokongan bahasanya kepada lebih 300 bahasa, satu pencapaian yang mengagumkan yang membawa gergasi carian lebih dekat kepada matlamat utamanya untuk bekerja merentas 1,000 bahasa. Pengumuman ini adalah hasil ikrar syarikat untuk membina model pembelajaran mesin yang merangkumi sebanyak mungkin bahasa.

USM, seni bina penyahkod pengekod standard, menggunakan Conformer untuk mengambil spektrogram log-mel isyarat pertuturan sebagai input dan melakukan sub-persampelan konvolusi. Model ini mempunyai dua bilion parameter dan telah dilatih mengenai 12 juta jam pertuturan dan 28 bilion ayat teks. Dalam istilah yang lebih mudah, GooglePenyelidik telah melatih model tersebut pada set data berbilang bahasa besar yang tidak berlabel dan memperhalusinya pada set data berlabel yang lebih kecil.

Pendekatan ini lebih berkesan daripada teknik terdahulu dan model itu telah digunakan oleh YouTube untuk menghasilkan kapsyen tertutup untuk bahasa yang kurang sumber seperti Amharic, Cebuano, Assam dan Azerbaijan, antara lain. USM mencapai kurang daripada 30% kadar ralat perkataan secara purata merentas 73 bahasa di YouTube.

Berbanding dengan Model Whisper OpenAI, USM mempunyai kadar ralat perkataan yang agak rendah untuk kira-kira 18 bahasa. Walau bagaimanapun, kecekapan pengiraan perlu dipertingkatkan untuk meluaskan liputan bahasa dan kualiti untuk mencapai matlamat tinggi syarikat.

Dalam Kesimpulan

USM Google adalah satu pencapaian yang mengagumkan pembelajaran mesin yang menetapkan standard untuk pemprosesan bahasa semula jadi. Dengan sokongan bahasa yang berkembang, model ini akan terus memacu inovasi dan membolehkan kebolehcapaian untuk bahasa yang kurang sumber di seluruh dunia.

Apakah reaksi anda?

Teruja
0
kehidupan keluarga yang bahagia
0
In Love
0
Tidak pasti
0
Bodoh
0
Mark Borg
Mark pakar dalam kejuruteraan robotik. Dengan latar belakang dalam kedua-dua kejuruteraan dan AI, dia terdorong untuk mencipta teknologi termaju. Pada masa lapang, dia gemar bermain catur dan berlatih strateginya.

    Awak juga mungkin menyukai

    Lagi dalam:Blog