گوگل روز دوشنبه بی سروصدا یک اپلیکیشن دیکته (تایپ صوتی) با اولویت آفلاین به اسم «Google AI Edge Eloquent» رو برای iOS منتشر کرد تا با رقبایی مثل Wispr Flow، SuperWhisper، Willow و بقیه رقابت کنه. این اپلیکیشن در واقع یک برنامه گفتار به متن آفلاین گوگل محسوب می شود.
ویژگی های کلیدی برنامه گفتار به متن آفلاین گوگل
دانلود این اپلیکیشن رایگانه و به محض اینکه مدل های تشخیص خودکار گفتار (ASR) مبتنی بر Gemma رو دانلود کنید، می تونید دیکته کردن رو روی گوشیتون شروع کنید. توی اپلیکیشن می تونید متن رو هم زمان با صحبت کردن ببینید و وقتی دکمه توقف رو بزنید، اپلیکیشن به صورت خودکار کلمات اضافی مثل «اِم» و «آه» رو حذف می کنه و متن رو مرتب تحویلتون می ده. این قابلیت ها، عملکرد یک برنامه گفتار به متن آفلاین گوگل را به شدت بهبود می بخشد.
پایین متن تایپ شده، گزینه هایی مثل «نکات کلیدی»، «رسمی»، «کوتاه» و «بلند» وجود داره تا بتونید متن رو تغییر بدید.
تصویر زیر رابط کاربری ساده و گزینه های سفارشی سازی متن در این اپلیکیشن جدید گوگل را نشان می دهد.

همان طور که مشاهده می کنید، کاربر می تواند به سادگی طول و لحن متن خروجی را بر اساس نیاز خود تنظیم کند.
منبع تصویر: اسکرین شات توسط TechCrunch
شما همچنین می تونید حالت ابری (Cloud Mode) رو خاموش کنید تا پردازش فقط به صورت محلی انجام بشه. (وقتی حالت ابری روشنه، اپلیکیشن از مدل های Gemini مبتنی بر ابر برای اصلاح متن استفاده می کنه.) اگه بخواید، Google AI Edge Eloquent می تونه کلمات کلیدی، نام ها و اصطلاحات خاص رو از اکانت جیمیل تون وارد کنه. علاوه بر این، می تونید کلمات سفارشی خودتون رو هم به لیست اضافه کنید. این ویژگی ها Eloquent را به یک برنامه گفتار به متن آفلاین گوگل قدرتمند تبدیل می کند.
این اپلیکیشن تاریخچه جلسات تایپ صوتی رو نشون می ده و بهتون اجازه می ده توی همشون جستجو کنید. این اپ می تونه کلماتی که در آخرین جلسه گفتید، سرعت تعداد کلمات در دقیقه و تعداد کل کلماتی که صحبت کردید رو بهتون نشون بده.
در توضیحات اپ استور این شرکت اومده: «Google AI Edge Eloquent یک اپلیکیشن دیکته پیشرفته ست که برای پر کردن فاصله بین گفتار طبیعی و متن حرفه ای و آماده استفاده، طراحی شده. برخلاف نرم افزارهای دیکته استاندارد که تپق ها و کلمات پرکننده رو دقیقا همون طور که هستن تایپ می کنن، Eloquent از هوش مصنوعی برای درک منظور شما استفاده می کنه. این اپلیکیشن به طور خودکار “اِم “ها، “آه”ها و اصلاحات وسط جمله رو حذف می کنه و یک متن تمیز و دقیق ارائه می ده.» به این ترتیب، برنامه گفتار به متن آفلاین گوگل تجربه کاربری بی نظیری را ارائه می دهد.
در این بخش از محیط برنامه، دقت بالای سیستم در تبدیل گفتار به نوشتار حتی در کلمات پیچیده مشهود است.

پردازش سریع و حذف کلمات اضافی باعث می شود خروجی نهایی بسیار حرفه ای و بدون نقص به نظر برسد.
من داشتم می گفتم «Transcription». هنوز روزهای اول این اپلیکیشن هست. منبع تصویر: TechCrunch
آینده برنامه گفتار به متن آفلاین گوگل و پلتفرم های دیگر
در حالی که این اپلیکیشن در حال حاضر فقط برای iOS در دسترسه، در توضیحات اپ استور به نسخه اندروید هم اشاره شده. (ما برای اطلاعات بیشتر با گوگل تماس گرفتیم و اگه جوابی بگیریم، این خبر رو به روزرسانی می کنیم.)
طبق توضیحات، Eloquent «یکپارچگی بی نقصی با اندروید» ارائه می ده، جایی که می شه اون رو به عنوان کیبورد پیش فرض کاربر برای دسترسی در کل سیستم و در هر فیلد متنی تنظیم کرد. علاوه بر این، این اپلیکیشن می تونه از قابلیت دکمه شناور، مشابه چیزی که Wispr Flow در اندروید استفاده می کنه، برای دسترسی آسون به تایپ صوتی از هر جایی استفاده کنه. این گسترش قابلیت، محبوبیت برنامه گفتار به متن آفلاین گوگل را افزایش خواهد داد.
اپلیکیشن های تایپ صوتی مبتنی بر هوش مصنوعی با بهتر شدن مدل های تبدیل گفتار به متن، دارن بین کاربران محبوبیت پیدا می کنن. گوگل با این اپلیکیشن آزمایشی، به این موج پیوسته. اگه این آزمایش موفقیت آمیز باشه، ممکنه شاهد ویژگی های بهبود یافته تایپ صوتی در قابلیت های هوشمند اندروید 16 هم باشیم و برنامه گفتار به متن آفلاین گوگل در آینده نقش پررنگ تری ایفا کند.
توسعه ابزارهایی مانند Eloquent نشان دهنده رویکرد جدید گوگل در استفاده از هوش مصنوعی برای بهبود تجربه های روزمره کاربران است. با تمرکز بر پردازش محلی و آفلاین، گوگل نه تنها سرعت و دقت را افزایش داده، بلکه گام بلندی در جهت حفظ حریم خصوصی کاربران و شخصی سازی ابزارهای بهره وری برداشته است.
Google quietly launched an AI dictation app that works offline