شرکت Cohere با معرفی خانواده مدل های Tiny Aya، گام مهمی در جهت گسترش هوش مصنوعی چندزبانه آفلاین برداشته است که امکان اجرای مدل های زبانی پیچیده را بدون نیاز به اینترنت بر روی دستگاه های شخصی فراهم می کند.
شرکت هوش مصنوعی سازمانی Cohere در حاشیه اجلاس هوش مصنوعی هند که در حال برگزاریه، از یه خانواده جدید از مدل های چندزبانه رونمایی کرد. این مدل ها که Tiny Aya نام دارن و امکان اجرای آفلاین را دارند، اوپن ویت (open-weight) هستن؛ یعنی کد منبعشون به صورت عمومی در دسترسه تا هر کسی بتونه ازشون استفاده کنه یا تغییرشون بده. این مدل ها از بیش از 70 زبان پشتیبانی می کنن و روی دستگاه های معمولی مثل لپ تاپ، بدون نیاز به اینترنت، قابل اجرا هستن، که آن ها را به نمونه ای بارز از هوش مصنوعی چندزبانه آفلاین تبدیل می کند.
این مدل که توسط بخش تحقیقاتی این شرکت یعنی Cohere Labs عرضه شده، از زبان های جنوب آسیا مثل بنگالی، هندی، پنجابی، اردو، گجراتی، تامیلی، تلوگو و مراتی پشتیبانی می کنه.
مدل پایه دارای 3.35 میلیارد پارامتره که نشون دهنده اندازه و پیچیدگی اونه. در حالی که بسیاری از غول های فناوری به دنبال ساخت مدل هوش مصنوعی اختصاصی در AWS برای سرویس های ابری هستند، Cohere تمرکز خود را بر مدل های سبک گذاشته است. Cohere همچنین مدل TinyAya-Global رو معرفی کرده که نسخه ای بهینه سازی شده برای اجرای بهتر دستورات کاربره و برای اپلیکیشن هایی که به پشتیبانی زبانی گسترده نیاز دارن، طراحی شده. نسخه های منطقه ای دیگه هم این خانواده رو تکمیل می کنن: TinyAya-Earth برای زبان های آفریقایی، TinyAya-Fire برای زبان های جنوب آسیا و TinyAya-Water برای منطقه آسیا-اقیانوسیه، غرب آسیا و اروپا. این مدل ها پایه های قدرتمندی برای توسعه هوش مصنوعی چندزبانه آفلاین در مناطق مختلف فراهم می کنند.
Tiny Aya؛ مدلی برای هوش مصنوعی چندزبانه آفلاین
در تصویر زیر، نمایی از قابلیت های مدل Tiny Aya در پردازش زبان های مختلف و تعامل با جوامع محلی را مشاهده می کنید.

اعتبار تصویر: Cohere
این تصویر نشان دهنده گستردگی زبانی و فرهنگی مدل های جدید Cohere در مقیاس جهانی است.
این شرکت در بیانیه ای اعلام کرد: «این رویکرد به هر مدل اجازه می ده تا پایه های زبانی قوی تر و ظرافت های فرهنگی بیشتری پیدا کنه و سیستم هایی رو بسازه که برای جوامع هدفشون، طبیعی تر و قابل اعتمادتر به نظر بیان. در عین حال، تمام مدل های Tiny Aya پوشش چندزبانه گسترده ای دارن که اون ها رو به نقاط شروع منعطفی برای انطباق و تحقیقات بیشتر تبدیل می کنه.»
شرکت Cohere اشاره کرد که این مدل ها روی یه کلاستر تک واحدی شامل 64 پردازنده گرافیکی H100 (یه نوع تراشه قدرتمند از شرکت انویدیا) با منابع محاسباتی نسبتا کم آموزش دیدن و برای محقق ها و توسعه دهنده هایی که دارن برای مخاطبان بومی اپلیکیشن می سازن، ایده آل هستن. این مدل ها قابلیت اجرا به صورت مستقیم روی دستگاه ها رو دارن، بنابراین توسعه دهنده ها می تونن از اون ها برای ارائه خدمات هوش مصنوعی چندزبانه آفلاین مانند ترجمه استفاده کنن. این شرکت اعلام کرده که نرم افزار زیربنایی خودش رو جوری ساخته که برای استفاده روی دستگاه مناسب باشه و نسبت به مدل های مشابه، به قدرت پردازشی کمتری نیاز داشته باشه. این رویکرد به ویژه برای توسعه دهندگانی که به دنبال پیاده سازی هوش مصنوعی چندزبانه آفلاین در محیط های بومی هستند، بسیار مفید است.
توسعه دهندگان می توانند از این مدل ها برای ایجاد ابزارهای کاربردی و هوشمند در محیط های فاقد دسترسی به اینترنت پایدار استفاده کنند.

اعتبار تصویر: Cohere
به کارگیری این فناوری در اپلیکیشن های موبایل و دسکتاپ، دسترسی به هوش مصنوعی را در مناطق دورافتاده و کم برخوردار تسهیل می کند.
گسترش کاربردهای هوش مصنوعی چندزبانه آفلاین
در کشورهای با تنوع زبانی زیاد مثل هند، این قابلیتِ کارکرد آفلاین می تونه راه رو برای مجموعه متنوعی از اپلیکیشن ها و کاربردها بدون نیاز به دسترسی همیشگی به اینترنت باز کنه. این مدل ها با ارائه هوش مصنوعی چندزبانه آفلاین، فرصت های جدیدی را برای جوامع محلی ایجاد می کنند.
این مدل ها در HuggingFace (پلتفرم محبوب برای اشتراک گذاری و تست مدل های هوش مصنوعی) و پلتفرم Cohere در دسترس هستن. توسعه دهنده ها می تونن اون ها رو از HuggingFace، Kaggle و Ollama برای استفاده محلی دانلود کنن. این شرکت همچنین دیتاست های آموزشی و ارزیابی رو در HuggingFace منتشر می کنه و قصد داره گزارش فنی جزئیات روش آموزش خودش رو هم منتشر کنه. دسترسی آسان به این مدل های هوش مصنوعی چندزبانه آفلاین، نوآوری در این حوزه را تسریع می بخشد.
آیدان گومز، مدیرعامل این استارتاپ، سال گذشته گفته بود که این شرکت قصد داره «به زودی» سهامی عام بشه. به گزارش CNBC، این شرکت سال 1404-1403 رو با موفقیت به پایان رسوند و 240 میلیون دلار درآمد سالانه ثبت کرد که در تمام طول سال، رشد 50 درصدی رو در هر فصل تجربه کرده.
توسعه مدل های سبک و کارآمد مانند Tiny Aya نشان دهنده مسیری است که در آن قدرت پردازش زبان از سرورهای بزرگ به دستگاه های کوچک خانگی منتقل می شود. این تحول نه تنها باعث افزایش حریم خصوصی کاربران می شود، بلکه با از بین بردن محدودیت های جغرافیایی و نیاز به پهنای باند بالا، دسترسی به تکنولوژی های روز را برای همگان عادلانه می کند.