رونمایی از مدل‌های زبانی فارسی همراه اول با حضور وزیر ارتباطات

تبلیغات بنری

هورناز (hornaz.ir):

مدل های زبان فارسی ساخته شده توسط رفیق اول با قابلیت تحلیل و یادگیری حجم زیادی از داده های متنی با هوش مصنوعی با حضور وزیر ارتباطات در اردوگاه 1403 رونمایی شد.

به گزارش اداره کل ارتباطات شرکت ارتباطات سیار ایران، گروه MCINext در اولین روز از نمایشگاه بین المللی الکامپ 1403 تعدادی از مدل های زبان توسعه یافته خود از جمله سیلک (با 1.3 میلیارد پارامتر) و آهوران (با 1.3 میلیارد پارامتر) را ارائه کرد. 8 میلیارد پارامتر). ) و آوا (با 13 میلیارد پارامتر) با حضور عیسی زری پور وزیر ارتباطات و فناوری اطلاعات در سالن تعیین شده برای هامارول 1 (سالن 35).

مدل‌های بزرگ زبانی (LLM) سیستم‌های هوش مصنوعی هستند که با تجزیه و تحلیل و یادگیری از حجم زیادی از داده‌های متنی، می‌توانند متن تولید کنند، آن را ترجمه کنند، به سؤالات پاسخ دهند و وظایف مختلف زبانی را انجام دهند و در حال حاضر با پشتیبانی R&D در حال توسعه هستند. مرکز.

مدل زبان ابریشم که از ابتدا با استفاده از مجموعه داده فارسی در این شرکت آموزش داده شد، با وجود تعداد نسبتا کم پارامترها، توانایی زبان خوبی را نشان می دهد که با ادامه روند آموزش در آینده، از نظر دانش بهتر خواهد بود. خواهد بود.

مدل Ahoran بر اساس مدل Llama3 چندزبانه متا است و به عنوان یک پیش‌آموزش مستمر بر روی مجموعه داده فارسی توسعه یافته است. با توجه به قابلیت های زیاد مدل پایه، آموزش مداوم تولید متن به زبان فارسی را افزایش داد، در حالی که سایر قابلیت های مدل تا حد زیادی حفظ شد.

کاربردهای تجاری این مدل ها بسیار گسترده است، مانند تولید خودکار محتوای متنی، پشتیبانی مشتری از طریق چت بات ها، تجزیه و تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای دستیار برای نویسندگان و مترجمان. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

مدل آوا برای پاسخگویی در یک زمینه خاص و بر اساس مدل Aya کوهر توسعه داده شد.

برخلاف دو مدل قبلی که به سوالات کلی پاسخ می‌دهند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخ (RAG) است و تا حد امکان از ارائه اطلاعات مورد استفاده در طول آموزش اجتناب می‌کند. کاربرد اصلی این مدل در پاسخ به ربات های خاص می باشد.

علاوه بر آموزش این مدل ها، تلاش شده است تا با کمک روش های تراز (RLHF و DPO) از تولید محتوای مخرب جلوگیری شود.

گروه MCINext First Companion در تلاش است تا این مدل ها را در آینده نزدیک به استفاده عمومی برساند.

تبلیغات بنری

entekhab به نقل از هورناز

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *