کدک صوتی تازهٔ رو دیدید؟ شگفت‌انگیزه! صدای انسان رو برای انتقال الکترونیکی فشرده می‌کنه، یعنی کاری می‌کنه که در آینده چت‌های صوتی با اینترنت‌های خیلی خیلی کم‌سرعت هم خوب شنیده بشن.

نکته‌اش؟ یادگیری ماشین رو به کار می‌بره، و نسبت کیفیت به حجمش ده‌ها (صدها؟) بار از بهترین کدک‌های صوتی موجود برای این کار (Opus و Speex) بهتره.

خودتون نمونه‌هایی رو که این‌جا گذاشته ببینید (بشنوید) و مقایسه کنید:

ai.googleblog.com/2021/02/lyra

پیگیری

فقط مشکل بالقوه‌اش اینه که وابسته به زبانی هست که باهاش صحبت می‌شه. یعنی مثلاً باید موتور یادگیری ماشینش جداگانه به فارسی هم «یاد بگیره» تا بتونه چت‌های صوتی فارسی رو هم خوب فشرده کنه. در وبلاگ گوگل نوشتن که حواسشون به این موضوع هست و سعی می‌کنن از همهٔ زبوه‌ها به تعداد کافی به سیستم‌شون «یاد بدهند».

بدترین اتفاقی (که نباید بیفته!) اینه که وقتی به انگلیسی حرف می‌زنیم صدا خوب بیاد و وقتی که فارسی حرف می‌زنیم صدا قطع بشه!

برای شرکت در گفتگو وارد حساب خود شوید
پرسادون

با دوستان خود گفتگو کنید و دوستان تازه پیدا کنید. عکس، ویدیو، و نوشته‌های خود را به اشتراک بگذارید. پرسادون یکی از سرورهای شبکهٔ اجتماعی بزرگ ماستودون است و می‌خواهد محیطی ایمن و پایدار برای کاربران فارسی‌زبان باشد. تا وقتی که به سیاست‌های کاربری و شرایط خدمات پرسادون احترام می‌گذارید، از بودن کنار شما در پرسادون خوشحال خواهیم شد.

راهنمای کاربری ماستودون در ویکی‌کتاب

دربارهٔ پرسادون