
تازه ها


توضیحات فراخوان
به گزارش بازارکار، هدف اصلی این پژوهش نیازمندی شرکت در نحوه استفاده از LLMهای فارسی در تکامل محصولات چتبات جاری است. که با استفاده از آن بتوان نیازهای متنوع مشتریان چتبات را پاسخ داد. مجری باید بتواند با استفاده از LLMهای موجود (داخلی و خارجی)، راهحلهای مجزایی به شرکت ارائه نماید که بتوان برای هر مشتری بهصورت جداگانه چتبات مخصوص آن را ساخت. این تحقیق باید بتواند کارهایی از قبیل پرسش و پاسخ، تشخیص مقصود، جداسازی اسلاتها، تشخیص مفهوم متن، خلاصهسازی، جستجوی معنایی و ... را با استفاده از مدلهای زبانی بزرگ (LLM) انجام دهد.
تبیین و تشریح مسئله پژوهشی
درخصوص LLMها، مدلهای Open Source نسبتاً زیادی وجود دارد و برخی از آنها فارسی را نیز پشتیبانی میکنند. نیاز فعلی ما توسعه LLM فارسی و عمومی نیست بلکه هدف آن است که از یک LLM فارسی (چه اپن سورس خارجی یا نسخههای فارسی موجود داخلی) و چه سرویسهایی مانند ChatGPT استفاده کرد و چتباتهای منطبق با نیاز مشتریان را توسعه داد. لذا در این پروژه به دنبال Fine Tuning کل مدل LLM نیستیم و هدف، استفاده از LLM ها برای پاسخدهی به نیازهای متنوع مشتریان است. حال ممکن است در این راه نیاز به Fine Tune هم باشد که این عملیات یک Fine Tunning بسیار کوچک و در قالب دامنه محتوایی مشتری انجام میشود که بتوان یک چتبات مخصوص آن مشتری تهیه نمود. لذا LLM پایهای انتخابی میتواند هرکدام از LLMهای Open Source داخلی یا خارجی باشد، و اصلاً یکی از وظایف مجری مقایسه LLMهای موجود و انتخاب بهترین آن برای پاسخدهی به نیاز مشتری میباشد.
مجری لازم است که نحوه بهکارگیری مدلهای زبانی بزرگ را برای هر مشتری بهصورت جداگانه انجام دهد. حال این روش می تواند از Zero Shot تا Fine Tune به تناسب نیاز هر مشتری متفاوت باشد. لازم به ذکر است مجری باید معماری و نحوه انجام این عملیات را بهصورت کامل برای کارفرما انجام دهد، تا کارفرما توانایی انجام این نوع کارها را برای سایر مشتریان نیز بدست آورد. بهطور خلاصه چند نمونه از نیاز مشتریان به مجری اعلام و مجری برای هر کدام بهصورت جداگانه باید یک LLM و همچنین راهکار استفاده بهینه از آن را ارائه دهد.
پژوهشگر بایستی بتواند در این پژوهش راهکار عملیاتی با ارائه نتایج پژوهشی مناسب برای هر یک از بخشهای زیر که برای مشتریان متفاوت است، را ارائه دهد:
۱- Open domain یا close domain باشد
۲- Inter personal باشد
۳- Task oriented یا chitchat باشد
۴- LLM based باشد که در همه حالتهای 5گانه زیر قابلیت ارائه راهکار مناسب باشد:
- ارائه راهکار NLU مبتنی بر LLM
- ارائه راهکار NLG مبتنی بر LLM
- استفاده از zero/few shot برای چتبات
- ارائه LLM فارسی fine tune شده برای یک چتبات
۵- ارائه روش مناسب مبتنی بر RAG برای چتبات فارسی
۶- بهترین مدلهای LLM فارسی موجود
۷- مدلهای LLM کد باز با معماری قابل استفاده مجدد فارسی
۸- نحوه استفاده از LLM در محصولات چتبات فارسی
۹- نحوه بهرهبرداری از LLM در افزایش دقت محصولات چتبات فارسی
۱۰- سایر سرویسها از قبیل:
- تشخیص مقصود
- جداسازی اسلاتها
- تشخیص موجودیت
- خلاصهسازی
- انتخاب بهترین پاسخ بین چند پاسخ
- جستجوی معنایی
- ساخت پاسخ
- تشخیص مفهوم
- Topic Modelling
- Question Answering
- Data Argumentation
چالشهای کلیدی نیاز فناورانه
یکی از موانع جدی این تحقیق، دقت مدلهای LLM در زبان فارسی است. با توجه به اینکه در دنیا LLMهای زیادی بهصورت چندزبانه وجود دارد، ولی دقت این مدلها در زبان فارسی بسیار کمتر از سایر زبانهای رایج از قبیل انگلیسی و زبانهای لاتین است. لذا افزایش دقت این مدلها در زبان فارسی از اهمیت زیادی برخوردار است. لازم به ذکر است که افزایش دقت بهصورت عمومی در زبان فارسی مدنظر نیست. بلکه افزایش دقت در زبان فارسی برای کاربردهای مختلف مشتریان کارفرما مدنظر است. و این افزایش دقت باید در پاسخدهی به سؤالات کاربران در محتوای مخصوص هر مشتری ایجاد شود.
چالش دوم و بسیار مهم، Fine Tune کردن یا آموزش مجدد این مدلهای زبانی بزرگ است که باید طوری انجام شود که نیاز به حداقل سختافزار GPU داشته باشد و بهصورت Agile باشد که برای هر نوع داده که از مشتری دریافت میشود بتوان با سرعت مناسبی آموزش مجدد را انجام داد.
چالش سوم مقدار مصرف GPU در این مدلها است. در تحقیق باید دقیقاً مشخص شود که برای افزایش سرعت این مدلها چه راهکارهایی وجود دارد.
چالش چهارم نحوه بهکارگیری LLMها برای هر کدام از مشتریان است. مشتریان ممکن است نیازمندیهای متفاوتی داشته باشند که با یک نوع LLM (حتی Fine Tune شده) نیز نتوان به تمامی آنها پاسخ داد. لذا باید برای هر نیاز مشتری، یک راهکار متناسب با آن نیاز ارائه شود تا به بهترین دقت رسید.
گامهای پژوهشی
مراحل پژوهش بهصورت ذیل پیشنهاد میشود:
فاز ۱: تحقیقات اولیه در مورد مدلهای زبانی بزرگ، مدلهای متنباز، زیرساختهای مشابه جهانی
- خروجی فاز: گزارشهای کامل از تحقیقات اولیه، مقایسه مدلهای مختلف از نظر دقت، سرعت و قابلیت
فاز ۲: طراحی معماری زیرساخت و یکپارچهسازی و اتصال آن
- خروجی فاز: ارائه معماری کامل، نحوه ارتباط اجزای مختلف، نحوه ارتباط با ماژولهای بیرونی
فاز ۳: پیادهسازی نسخهی اول زیرساخت
- خروجی فاز: تحویل نرمافزار اجرایی بهصورت عملیاتی
فاز ۴: پیادهسازی و تحویل نسخهی نهایی زیرساخت
- خروجی فاز: تحویل نرمافزار اجرایی بهصورت عملیاتی و اشکالزدایی شده
خروجی پژوهش
خروجیهای این پروژه شامل موارد زیر خواهد بود:
- کدهای نرمافزاری پروژه: شامل تمامی برنامههای نوشته شده به زبانهای برنامهنویسی مختلف، تنظیمات برنامهنویسی، تمامی مخازن پروژههای برنامهنویسی و پکیجهای آنها
- طراحی معماری: شامل شرح و طراحی معماری کلی سیستم نهایی و مؤلفههای مختلف آن و نحوه و پروتکل ارتباطی آنها
- مستندات اتصال و یکپارچهسازی: شامل مستندات لازم برای یکپارچهسازی سیستم با سایر سیستمها مانند API Reference
- مستندات استقرار: مستندات راهنمای استقرار سیستم اعم از منابع سختافزاری و شبکهای مورد نیاز، برنامههای سیستمی لازم برای راهاندازی پروژه و سیستم عامل لازم برای استقرار
- پژوهشهای علمی در راستای مدلهای زبانی: تمامی پژوهشهایی که در راستای شناخت بهتر ظرفیتهای مدلهای زبانی و مدلهای زبانی مولد برای اجرای این پروژه صورت گرفته، اعم از مطالعات تطبیقی یا توسعه دانش جدید در این حوزه
تسهیم مالکیت فکری
- مالکیت معنوی: مجری در مالکیت معنوی ناشی از اجرای پژوهش سهیم خواهد بود و انتشار مقاله مشترک توسط مجری و متقاضی در ژورنالهای داخلی و خارجی، ارائه مقاله در کنفرانسها و سمینارها با موافقت و اشاره بهنام همه دستاندرکاران مجاز خواهد بود.
- مالکیت منافع مادی: با توجه به مدل کسبوکار و اجرا و اثبات دستاوردهای حاصل از طرح توسط شرکت متقاضی، منافع مالی ناشی از توسعه این فناوری برای شرکت متقاضی خواهد شد اما مطابق تراضی بین شرکت متقاضی و مجری، قابل اشتراک بین آنها خواهد بود.
نحوه پذیرش
پذیرش طرحها رقابتی است و از بین پروپوزالهای دریافتی، موردی که شرایط زیر را داشته باشد، در اولویت خواهد بود:
- ترکیب متخصصین تیم پیشنهادی مرتبط باشد.
- افراد پیشنهادشده، دارای سابقه پژوهشی و فنی در آن موضوع باشند.
- زمانبندی، هزینه و شرح خدمات، متناسب و مرتبط با پژوهش موردتقاضا باشد. (در این بخش، مجری میتواند برآورد اولیه خود را اعلام کند اما بدیهی است جزئیات اجرایی در ابتدای امر مشخص نیست و مجری و کارفرما با علم به این موضوع وارد این توافق خواهند شد)
- پروپوزال، طبق فرمت پیشنهادی بنیاد، تهیه و از طریق سامانه کایپر ارسال شده باشد.
- فونت حروف و اعداد فارسی B Nazanin و اندازه قلم ۱۳ و فونت حروف و اعداد انگلیسی، Times New Roman و اندازه قلم ۱۱ باشد.
هزینههای قابل قبول
- حقالتحقیق نیروی انسانی؛
- هزینههای نرمافزاری؛
- تستها و آنالیزها؛
- خدمات؛
حوزههای اولویتدار
مهندسی کامپیوتر/هوش مصنوعی
واجدین شرایط
پژوهشگر اصلی تیم لازم است عضو هیئتعلمی فعال یکی از دانشگاهها و مؤسسات آموزش عالی کشور باشد. پس از دریافت پروپوزال از طریق سامانه، ارزیابی انجام گرفته و در صورت کسب امتیاز بالا، تیم برگزیده جهت مذاکره با بنیاد و شرکت متقاضی دعوت خواهد شد.
فایلهای پیوست
تاریخ فراخوان
کلیه افراد واجد شرایط تا پایان فروردین فرصت دارند که پروپوزال خود را از طریق سامانه کایپر برای بنیاد ملی علم ایران ارسال نمایند.
توجه: تاریخ این فراخوان تمدید نخواهد شد و فقط پروپوزالهای ارسالی در بازه زمانی اعلام شده در فراخوان، به مرحله داوری خواهند رفت.
مبلغ حمایت
پژوهش پیشنهاد شده تا سقف ۸۰ درصد، حداکثر ۲.۵ میلیارد تومان، توسط بنیاد ملی علم ایران حمایت خواهد شد. بدیهی است که مابقی هزینهها باید توسط شرکت متقاضی ارائه دهنده پژوهش تأمین شود.
شیوه ثبت نام و ارسال درخواست
متقاضیان جهت ثبتنام میتوانند به سامانه کایپر مراجعه و از طریق بخش متقاضیان/ پژوهشگران اقدام نمایند. درصورتیکه در این سامانه پروفایل مشخصات فردی ندارید ابتدا ثبتنام نموده و سپس بهوسیله نام کاربری (Email) و رمز عبور اعطا شده وارد سامانه شوید. پس از ورود در بخش ارسال طرح جدید میتوانید از کارتابل پژوهش عمیق شرکتهای دانشبنیان اقدام به ارسال طرح نمایید.
مسئول پاسخگویی
پژوهشگران پس از مطالعه توضیحات فراخوان و آیین نامههای مربوطه در پورتال بنیاد علم، در صورت داشتن هر گونه ابهام یا سؤال در خصوص فرایند ارسال طرح، شرایط و محتوای علمی فراخوان میتوانند از پروفایل خود در سامانه کایپر با کارگروه دانشبنیان از طریق تیکت، یا با ایمیل jandili.a@insf.org سؤالات خود را مطرح نمایند و یا با شماره تلفن ۰۲۱۸۲۱۶۱۱۵۰(آقای جندیلی) تماس حاصل فرمایند.
ارسال نظرات