پیگیری

کدک صوتی تازهٔ رو دیدید؟ شگفت‌انگیزه! صدای انسان رو برای انتقال الکترونیکی فشرده می‌کنه، یعنی کاری می‌کنه که در آینده چت‌های صوتی با اینترنت‌های خیلی خیلی کم‌سرعت هم خوب شنیده بشن.

نکته‌اش؟ یادگیری ماشین رو به کار می‌بره، و نسبت کیفیت به حجمش ده‌ها (صدها؟) بار از بهترین کدک‌های صوتی موجود برای این کار (Opus و Speex) بهتره.

خودتون نمونه‌هایی رو که این‌جا گذاشته ببینید (بشنوید) و مقایسه کنید:

ai.googleblog.com/2021/02/lyra

فقط مشکل بالقوه‌اش اینه که وابسته به زبانی هست که باهاش صحبت می‌شه. یعنی مثلاً باید موتور یادگیری ماشینش جداگانه به فارسی هم «یاد بگیره» تا بتونه چت‌های صوتی فارسی رو هم خوب فشرده کنه. در وبلاگ گوگل نوشتن که حواسشون به این موضوع هست و سعی می‌کنن از همهٔ زبوه‌ها به تعداد کافی به سیستم‌شون «یاد بدهند».

بدترین اتفاقی (که نباید بیفته!) اینه که وقتی به انگلیسی حرف می‌زنیم صدا خوب بیاد و وقتی که فارسی حرف می‌زنیم صدا قطع بشه!

@hamid
حدس می‌زنم آزاد باشه. معمولاً گوگل چیزهای از این جنس رو (پایه‌های فناوری) آزاد منتشر می‌کنه، بر خلاف اپ‌ها و برنامه‌های سمت کاربرش که معمولاً انحصاری هستند.

@masoud
فعلا که چیزی نگفتن ولی امیدوارم این طور باشه.
البته همیشه هم این طوری نیستا. مثلا tts و اینا هم پایه فناورین ولی گوگل اجارشون می ده.

@hamid
مثال tts رو که گفتی ترسیدم! من هم امیدوارم آزادش کنند.

@hamid
البته چیزهای بر پایهٔ یادگیری ماشین، آزادبودنشون یه کم پیچیده‌تره. حتی اگه کدهای متعارف (کد سی و پایتون و...) هم آزاد باشه، تا وقتی نمونه‌هایی که ماشین باهاش یادگرفته آزاد نباشند و کل فرایند یادگیری ماشین برای بقیه در دسترس نباشه، خیلی نمی‌شه به سیستمش و خروجی‌هاش اعتماد کرد.

شاید اگه بخواد نسخهٔ تازه‌ای از دربیاد، شرط‌هایی در این باره رو هم باید بهش اضافه کنن.


برای شرکت در گفتگو وارد حساب خود شوید
پرسادون

با دوستان خود گفتگو کنید و دوستان تازه پیدا کنید. عکس، ویدیو، و نوشته‌های خود را به اشتراک بگذارید. پرسادون یکی از سرورهای شبکهٔ اجتماعی بزرگ ماستودون است و می‌خواهد محیطی ایمن و پایدار برای کاربران فارسی‌زبان باشد. تا وقتی که به سیاست‌های کاربری و شرایط خدمات پرسادون احترام می‌گذارید، از بودن کنار شما در پرسادون خوشحال خواهیم شد.

راهنمای کاربری ماستودون در ویکی‌کتاب

دربارهٔ پرسادون