ارزیابی یادگیری هوش مصنوعی ایرانی رخشای نسخه “زال”

معیارهای دقت در ارزیابی هوش مصنوعی شامل معیارهای مختلفی مانند دقت (accuracy)، F1-score و BLEU هستند.

طبق آخرین محاسبات ما دقت یادگیری موتور پردازشی “زال” شرکت آریاهامان مهرپارسه بدون استفاده از بستر یادگیری لحظه ای و آنلاین سامانه auto-gpt تا این لحظه به 4 درصد رسیده و به صورت تناسبی و نوسانی در حال افزایش است .

سیستم محاسباتی ما چگونه است ؟

  • دقت (Accuracy): این معیار، نسبت تعداد پاسخ‌های درست به کل پاسخ‌ها را نشان می‌دهد. برای محاسبه دقت، تعداد پاسخ‌های درست را بر تعداد کل پاسخ‌ها تقسیم می‌کنیم 1.
  • F1-score: این معیار، ترکیب دقت و بازخوانی (recall) است. برای محاسبه F1-score، از فرمول زیر استفاده می‌شود:F1-score = 2 * (precision * recall) / (precision + recall)که در آن precision برابر با نسبت تعداد پاسخ‌های درست به کل پاسخ‌های پیش‌بینی شده و recall برابر با نسبت تعداد پاسخ‌های درست به کل پاسخ‌های واقعی است .
  • BLEU: این معیار، برای اندازه‌گیری شباهت بین گفتگوها و سورس های متنی ما استفاده می‌شود. BLEU، نسبت تعداد کلمات مشابه در پاسخ مدل به پاسخ واقعی را نشان می‌دهد

Check Also

اولین مدل بزرگ زبانی (LLM) آفلاین فارسی در ایران با 400 میلیارد پارامتر (ZAL PLUS LLM)

سامانه رخشای برای نخستین بار در ایران، یک مدل بزرگ زبانی فارسی به نام “زال …