رونمایی از مدل‌های زبانی فارسی همراه اول با حضور وزیر ارتباطات

هورناز (hornaz.ir):

مدل های زبان فارسی ساخته شده توسط رفیق اول با قابلیت تحلیل و یادگیری حجم زیادی از داده های متنی با هوش مصنوعی با حضور وزیر ارتباطات در اردوگاه 1403 رونمایی شد.

به گزارش اداره کل ارتباطات شرکت ارتباطات سیار ایران، گروه MCINext در اولین روز از نمایشگاه بین المللی الکامپ 1403 تعدادی از مدل های زبان توسعه یافته خود از جمله سیلک (با 1.3 میلیارد پارامتر) و آهوران (با 1.3 میلیارد پارامتر) را ارائه کرد. 8 میلیارد پارامتر). ) و آوا (با 13 میلیارد پارامتر) با حضور عیسی زری پور وزیر ارتباطات و فناوری اطلاعات در سالن تعیین شده برای هامارول 1 (سالن 35).

مدل‌های بزرگ زبانی (LLM) سیستم‌های هوش مصنوعی هستند که با تجزیه و تحلیل و یادگیری از حجم زیادی از داده‌های متنی، می‌توانند متن تولید کنند، آن را ترجمه کنند، به سؤالات پاسخ دهند و وظایف مختلف زبانی را انجام دهند و در حال حاضر با پشتیبانی R&D در حال توسعه هستند. مرکز.

مدل زبان ابریشم که از ابتدا با استفاده از مجموعه داده فارسی در این شرکت آموزش داده شد، با وجود تعداد نسبتا کم پارامترها، توانایی زبان خوبی را نشان می دهد که با ادامه روند آموزش در آینده، از نظر دانش بهتر خواهد بود. خواهد بود.

مدل Ahoran بر اساس مدل Llama3 چندزبانه متا است و به عنوان یک پیش‌آموزش مستمر بر روی مجموعه داده فارسی توسعه یافته است. با توجه به قابلیت های زیاد مدل پایه، آموزش مداوم تولید متن به زبان فارسی را افزایش داد، در حالی که سایر قابلیت های مدل تا حد زیادی حفظ شد.

کاربردهای تجاری این مدل ها بسیار گسترده است، مانند تولید خودکار محتوای متنی، پشتیبانی مشتری از طریق چت بات ها، تجزیه و تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای دستیار برای نویسندگان و مترجمان. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

مدل آوا برای پاسخگویی در یک زمینه خاص و بر اساس مدل Aya کوهر توسعه داده شد.

برخلاف دو مدل قبلی که به سوالات کلی پاسخ می‌دهند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخ (RAG) است و تا حد امکان از ارائه اطلاعات مورد استفاده در طول آموزش اجتناب می‌کند. کاربرد اصلی این مدل در پاسخ به ربات های خاص می باشد.

علاوه بر آموزش این مدل ها، تلاش شده است تا با کمک روش های تراز (RLHF و DPO) از تولید محتوای مخرب جلوگیری شود.

گروه MCINext First Companion در تلاش است تا این مدل ها را در آینده نزدیک به استفاده عمومی برساند.

entekhab به نقل از هورناز

تاریخ و ساعت بازی نساجی و استقلال خوزستان در لیگ برتر ایران، هفته نهم

تعرفه تبلیغات

خواص باورنکردنی پوست لیمو ترش

مزایای خرید فالوور اینستاگرام

هفت عامل برای تیم سازی موثر

پرچم فلسطین در پارلمان فرانسه به اهتزاز درآمد

رونمایی از مدل‌های زبانی فارسی همراه اول با حضور وزیر ارتباطات

دیدگاهتان را بنویسید لغو پاسخ

تاریخ و ساعت بازی نساجی و استقلال خوزستان در لیگ برتر ایران، هفته نهم

کاخ سفید: تاکنون بیش از سه هزار سرباز کره شمالی به روسیه اعزام شده‌اند / احتمالا برخی از این نیرو‌ها در منطقه کورسک روسیه مستقر خواهند شد

سبحانی، اقتصاددان: سال آینده ۴۴٪ هزینه های دولت از محل قرض و فروش دارایی تامین می شود / ادامه این رویه فرسایشی، بودجه نویسی نیست، توسعه انحرافات مالی پیشینیان است

محمد درویش، پژوهشگر و فعال محیط زیست: دو سوم کل ذخیره آب یک هزارساله را در سه دهه اخیر مصرف کرده‌ایم / فرونشست در کشور طی ۵ سال اخیر ٣ برابر شده

تاریخ و ساعت بازی مس رفسنجان و ملوان در لیگ برتر ایران، هفته نهم