نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

تبلیغات بنری


هورناز (hornaz.ir):

این نشست تخصصی به منظور معرفی و نمایش تعدادی از مدل های زبانی توسعه یافته توسط گروه MCINext که سامانه های مرتبط با هوش مصنوعی هستند در نمایشگاه الکامپ 1403 برگزار شد.

به گزارش اداره کل ارتباطات شرکت ارتباطات سیار ایران، گروه MCINext در سومین روز از نمایشگاه بین المللی الکامپ 1403 از تعدادی از مدل های زبان پیشرفته خود از جمله Silk (با 1.3 میلیارد پارامتر)، اهوران (با 8 پارامتر) رونمایی کرد. میلیارد پارامتر) و آوا (با 13 میلیارد پارامتر) با حضور آرش امینی، رئیس اداره تحقیق و توسعه هوش مصنوعی MCINEXT و حمید طهمورثی، مدیر ارشد فناوری MCINEXT در سالن خلیج فارس نمایشگاه بین المللی تهران، در نشست تخصصی، کارکردها و ویژگی های هر یک از آنها ارائه شد.

در این نشست علاوه بر تاکید بر توسعه محصولات مبتنی بر هوش مصنوعی، دستاوردهای این گروه از جمله اولین ربات پاسخگوی تلفن همراه و چندین مدل زبانی که برای استفاده عموم در دسترس قرار گرفته است، ارائه شد.

مدل‌های بزرگ زبانی (LLM) سیستم‌های هوش مصنوعی هستند که با تجزیه و تحلیل و یادگیری از مقدار زیادی از داده‌های متنی، می‌توانند متن تولید کنند، آن را ترجمه کنند، به سؤالات پاسخ دهند و در حال حاضر با پشتیبانی مرکز تحقیقات انجام دهند و مطالعات، توسعه در کنار اولی در حال توسعه است.

در زیر، هر یک از مدل های زبان اصلی مجموعه First Companion MCINEXT ارائه و نشان داده شده است.

*مدل زبان سیالک

مدل زبان ابریشم که از ابتدا با استفاده از مجموعه داده فارسی در این شرکت آموزش داده شد، با وجود تعداد نسبتا کم پارامترها، توانایی زبان خوبی را نشان می دهد که با ادامه روند آموزش در آینده، از نظر دانش بهتر خواهد بود. خواهد بود.

* الگوی زبانی اهورانی

مدل Ahoran بر اساس مدل Llama3 چندزبانه متا است و به عنوان یک پیش‌آموزش مستمر بر روی مجموعه داده فارسی توسعه یافته است. با توجه به قابلیت های زیاد مدل پایه، آموزش مداوم تولید متن به زبان فارسی را افزایش داد، در حالی که سایر قابلیت های مدل تا حد زیادی حفظ شد.

کاربردهای تجاری این مدل ها بسیار گسترده است، مانند تولید خودکار محتوای متنی، پشتیبانی مشتری از طریق چت بات ها، تجزیه و تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای دستیار برای نویسندگان و مترجمان. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

* مدل زبان آوا

مدل آوا برای پاسخگویی در یک زمینه خاص و بر اساس مدل Aya کوهر توسعه داده شد.

برخلاف دو مدل قبلی که به سوالات کلی پاسخ می‌دهند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخ (RAG) است و تا حد امکان از ارائه اطلاعات مورد استفاده در طول آموزش اجتناب می‌کند. کاربرد اصلی این مدل در پاسخ به ربات های خاص می باشد.

علاوه بر آموزش این مدل ها، تلاش شده است تا با کمک روش های تراز (RLHF و DPO) از تولید محتوای مخرب جلوگیری شود.

علاقه مندان می توانند از طریق https://llm.mcinext.org به این مدل های زبان دسترسی داشته باشند.

تبلیغات بنری

entekhab به نقل از هورناز

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *