نشریه رخشای

رویدادهای هوش مصنوعی ایرانی

چهار برابر تحلیل فارسی قوی‌تر؛ وقتی Rakhshai Graph-based NLP به مدل‌های بزرگ زبانی «شواهد بیشتر» می‌دهد

9 دقیقه مطالعه

زبان فارسی فقط مجموعه‌ای از کلمه‌ها نیست. هر جمله فارسی، مخصوصاً در متن‌های ادبی، خبری، حقوقی، پزشکی، شبکه‌های اجتماعی یا محتوای سازمانی، پر از رابطه‌های پنهان است؛ رابطه میان واژه‌ها، نقش‌ها، مفهوم‌ها، اشاره‌ها، نشانه‌ها و حتی سکوت‌هایی که در متن حضور دارند. بسیاری از مدل‌های هوش مصنوعی متن را خوب می‌خوانند، اما همیشه نمی‌دانند کدام بخش متن مهم‌تر است، کدام واژه‌ها به هم وصل‌اند و چرا یک نتیجه خاص گرفته شده است.

دشواری اصلی تحلیل فارسی چیست؟

وقتی یک انسان متن فارسی را می‌خواند، فقط کلمه‌ها را پشت سر هم نمی‌بیند. مثلاً در یک شعر، «آینه»، «سایه»، «چراغ»، «رود»، «تشنگی»، «خانه» و «کلید» فقط چند واژه جدا نیستند؛ هرکدام بخشی از یک شبکه معنایی‌اند. در متن‌های سازمانی هم همین است: نام افراد، رویدادها، اسناد، نیت‌ها، زمان‌ها، هشدارها و نشانه‌ها به هم وصل‌اند.

مدل‌های زبانی معمولی معمولاً متن را به‌صورت دنباله‌ای از توکن‌ها پردازش می‌کنند. این روش قدرتمند است، اما همیشه برای فارسی کافی نیست؛ چون فارسی زبانی پر از وابستگی‌های نحوی، معناهای ضمنی، حذف، ایهام، ترکیب‌های استعاری و رابطه‌های غیرمستقیم است.

Rakhshai Graph-based NLP این مسئله را برای متن ها با زبان فارسی از زاویه‌ای متفاوت حل می‌کند: متن فارسی را به گراف تبدیل می‌کند. یعنی به جای اینکه فقط بپرسد «بعد از این کلمه چه می‌آید؟»، می‌پرسد:
این کلمه به چه مفاهیمی وصل است؟ کدام رابطه‌ها مهم‌ترند؟ کدام مسیر معنایی به نتیجه بهتر می‌رسد؟
این مقاله پیرامون قابلیت mcp پروژه است که در تاریخ زیر منتشر شده :
میلادی: پنج‌شنبه، ۲ جولای ۲۰۲۶
خورشیدی: پنج‌شنبه، ۱۱ تیر ۱۴۰۵


لینک پروژه متن باز Rakhshai Graph-based NLP :

MCP چه چیزی به پروژه متن باز Rakhshai Graph-based NLP اضافه می‌کند؟

هدف اصلی ما ساخت یک زیرساخت ایرانی برای پردازش عمیق متن فارسی بوده است. رخشای تلاش می‌کند متن فارسی را با تکیه بر ساختارهای گرافی، حافظه گرافی، تحلیل معنایی و مدل‌سازی بومی زبان، به شکلی دقیق‌تر و قابل توضیح‌تر درک کند و در مسیر توسعه خود به سمت تولید مدل ایرانی پردازش متن فارسی حرکت می‌کند. پشتیبانی از MCP بخشی از قدرت این پروژه است، نه تمام آن؛ MCP به رخشای کمک می‌کند توانایی‌های خود را در اختیار Agentها، چت‌بات‌ها و مدل‌های مطرح هوش مصنوعی قرار دهد، اما هسته اصلی پروژه همچنان بر توسعه فناوری بومی برای زبان فارسی استوار است.

قابلیت جدید MCP Support باعث می‌شود این کتابخانه فقط یک کتابخانه پردازش متن نباشد، بلکه به یک لایه قابل اتصال برای Agentها، چت‌بات‌ها، IDEها، ابزارهای توسعه و مدل‌های بیرونی تبدیل شود. خود MCP یا Model Context Protocol یک استاندارد متن‌باز برای اتصال برنامه‌های هوش مصنوعی به ابزارها، داده‌ها و workflowهای بیرونی است؛ میتوان MCP از آن به‌عنوان چیزی شبیه «USB-C برای اپلیکیشن‌های هوش مصنوعی» یاد کرد.

به زبان ساده، MCP در این پروژه کاری می‌کند که یک مدل هوش مصنوعی بتواند به‌جای حدس‌زدن، از ابزار تخصصی کمک بگیرد. در اینجا، ابزار تخصصی همان Rakhshai Graph-based NLP است؛ ابزاری که متن فارسی را تحلیل می‌کند، گراف می‌سازد، مفاهیم مهم را بیرون می‌کشد، رابطه‌ها را نشان می‌دهد و به مدل می‌گوید:
برای پاسخ دادن، این شواهد را هم ببین.

از تحلیل ساده تا تحلیل قابل توضیح برای زبان فارسی

تفاوت مهم Rakhshai Graph-based NLP با بسیاری از روش‌های معمول این است که خروجی آن فقط یک جواب نهایی نیست. این پروژه می‌تواند نشان دهد کدام گره‌ها، رابطه‌ها و مسیرهای استدلالی در تحلیل نقش داشته‌اند. در مستندات MCP پروژه، ابزارهایی مثل تحلیل متن فارسی، ساخت گراف دانشی، خلاصه‌سازی گراف‌محور، تولید پاسخ با Graph Memory، توضیح خروجی با گره‌ها و رابطه‌ها، و بهینه‌سازی پرامپت فارسی معرفی شده‌اند.

این موضوع برای مخاطب عمومی یعنی اعتماد بیشتر. وقتی سیستم می‌گوید یک متن درباره نگرانی، هشدار، تهدید، احساس منفی یا یک مفهوم خاص است، می‌توان پرسید: «چرا؟» و این روش می‌تواند مسیر را نشان دهد.

برای تیم‌های فنی هم این یعنی خروجی فقط black box نیست. در معماری MCP پروژه، مسیر کلی به این شکل طراحی شده است:
متن فارسی وارد می‌شود، به گراف دانشی تبدیل می‌شود، استدلال گرافی و Graph Memory روی آن عمل می‌کنند و در نهایت خروجی قابل توضیح تولید می‌شود.

چهار برابر قوی‌تر؛ این عدد دقیقاً یعنی چه؟

تیتر «چهار برابر تحلیل فارسی قوی‌تر» جذاب است، اما باید درست و شفاف توضیح داده شود. طبق گزارش تست تک‌نمونه‌ای پروژه، اتصال Rakhshai Graph-based NLP MCP به مدل بیرونی در تحلیل یک شعر فارسی (به عنوان نمونه ای که مدل های بزرگ زبانی سخت میتوانند مفهوم آن را درک کنند) باعث شد تعداد استفاده‌های مؤثر از شواهد معنایی از ۱ به ۴ برسد؛ یعنی از نظر استفاده از شواهد معنایی پنهان در پاسخ، خروجی ۴ برابر قوی‌تر شد. در همان گزارش، امتیاز کلی تحلیل نیز از ۲۱ به ۲۵ رسید؛ یعنی حدود ۱۹٪ بهبود در کیفیت کلی پاسخ (درک عمومی سوال) نسبت به حالت direct گزارش شده است .

این نکته مهم است: این عدد یک ادعای عمومی برای همه متن‌ها و همه مدل‌ها نیست؛ بلکه نتیجه یک تست مشخص روی یک نمونه شعر فارسی است که قابلیت تکرار توسط کاربر را هم دارد . اما همین تست نشان می‌دهد وقتی مدل هوش مصنوعی به‌جای تحلیل تنها، از شواهد افزوده پروژه کمک می‌گیرد، پاسخ می‌تواند دقیق‌تر، مستندتر و قابل توضیح‌تر شود.

متن شعری که برای تست استفاده شده : (به دلیل درک سخت مفاهیم پنهان شعر در زبان فارسی – شعر برای نمونه تست استفاده شده است .)

در آینه، سایه‌ام از من قدیمی‌تر بود
و نامم از دهانِ پنجره به باران می‌ریخت

چراغی که خوابِ خاکستر می‌دید
راه را به پای گم‌شده‌ام نشان نمی‌داد

رود از کنار من گذشت
اما تشنگی در مشت‌هایم لانه کرده بود

گفتم: کدام سو خانه است؟
باد، کلیدی زنگ‌زده را در سکوت چرخاند

تست اجرایی

ردیفنام مدل تست‌شدهشرکت سازنده / ارائه‌دهندهنقش در تستتنظیمات اصلی تست
۱gpt-5.4OpenAIمدل بیرونی برای مقایسه دو حالت پاسخ‌گویی: مستقیم و متصل به Rakhshai MCPtemperature=0، top_p=1، max_output_tokens=3000، seed=42 درخواست شد؛ تست بدون seed ولی با شرایط یکسان تکرار شد.
حالت تستسوال / درخواست ارسال‌شده به APIتفاوت اصلی در ورودیخلاصه پاسخ دریافتینتیجه ارزیابی
حالت A — پاسخ مستقیم / Direct«به این سوال درباره شعر پاسخ بده. سوال: این شعر از دید تو چه معنی می‌دهد؟ معنی اصلی شعر را ساده توضیح بده و بگو رابطه میان آینه، سایه، نام، چراغ، رود، تشنگی، خانه و کلید چیست؟» سپس متن کامل شعر ارسال شده است.مدل فقط خود شعر و سوال کاربر را دریافت کرده؛ هیچ شواهد گرافی از رخشای به آن داده نشده است.پاسخ، شعر را درباره گم‌گشتگی، بحران هویت، نرسیدن به آرامش و جست‌وجوی خانه واقعی تفسیر کرده است. همچنین نمادها را جداگانه توضیح داده: آینه برای خودشناسی، سایه برای گذشته یا بخش پنهان وجود، نام برای هویت، چراغ برای راهنمایی، رود برای امکان نجات، تشنگی برای نیاز درونی، خانه برای آرامش و کلید برای راه‌حل یا ورود.امتیاز دستی: 21 از ۲۵. تعداد استفاده مؤثر از شواهد: 1. سیگنال توضیح‌پذیری گرافی: نداشت.
حالت B — متصل به Rakhshai MCPهمان سوال و همان شعر ارسال شده، اما این جمله هم به درخواست اضافه شده است: «از شواهد گرافی Rakhshai MCP فقط وقتی استفاده کن که مرتبط است. در پاسخ توضیح بده کدام گره‌ها یا رابطه‌ها کمک کردند.» سپس خروجی تحلیلی رخشای شامل گره‌ها، رابطه‌ها، مسیرهای استدلالی و Graph Memory هم به ورودی اضافه شده است.مدل علاوه بر شعر، شواهد گرافی رخشای را هم دریافت کرده؛ مثل گره‌های مهم گم‌شده‌ام، خواب، سو، کلیدی، دهان، خانه و رابطه‌هایی مثل دهان ↔ پنجره، باران ↔ می‌ریخت و خواب ↔ خاکستر.پاسخ، همان مضمون اصلی را دقیق‌تر و مستندتر توضیح داده: بحران هویت، گم‌کردن راه، جست‌وجوی خانه، و وجود نشانه‌های نجات در کنار ناتوانی در رسیدن به آن‌ها. تفاوت مهم این پاسخ این بود که در پایان توضیح داد کدام گره‌ها و رابطه‌های گرافی باعث تقویت تحلیل شده‌اند؛ مثلاً گره گم‌شده‌ام برای گم‌گشتگی، خانه و کلیدی برای مسئله رسیدن و گشودن، و رابطه خواب ↔ خاکستر برای خاموشی چراغ.امتیاز دستی: 25 از ۲۵. تعداد استفاده مؤثر از شواهد: 4. سیگنال توضیح‌پذیری گرافی: داشت. بهبود کلی نسبت به حالت مستقیم: حدود 19٪. بهبود در استفاده از شواهد: 4x.

چرا این برای اکو سیستم زبان فارسی در مدل های هوش مصنوعی مهم است؟

اکو سیستم زبان فارسی در مدل های هوش مصنوعی به ابزارهایی نیاز دارد که فقط ترجمه‌شده یا تقلیدی از مدل‌های انگلیسی نباشند. فارسی ساختار، نشانه‌ها و پیچیدگی‌های خودش را دارد. Rakhshai Graph-based NLP از ابتدا برای متن فارسی طراحی شده است: از پیش‌پردازش و توکن‌سازی فارسی تا ساخت گراف‌های هم‌رخدادی، نحوی، معنایی، واژه-سند و حافظه گرافی و ساخت مدل .

این یعنی محصول می‌تواند در سناریوهای واقعی استفاده شود: تحلیل بازخورد مشتریان، طبقه‌بندی خبر، پایش شبکه‌های اجتماعی، خلاصه‌سازی اسناد، تحلیل محتوای فارسی، ساخت چت‌بات تخصصی، تحلیل شعر و ادبیات، استخراج مفهوم از گزارش‌ها و ایجاد Agentهای فارسی‌زبان.

Rakhshai Graph-based NLP برای کاربر غیرتخصصی چه ارزشی دارد؟

برای کاربر عمومی، این پروژه یعنی هوش مصنوعی‌ای که فارسی را سطحی نمی‌خواند. یعنی وقتی متنی را تحلیل می‌کند، فقط چند کلمه کلیدی تحویل نمی‌دهد؛ رابطه‌ها را هم می‌بیند. اگر در یک متن، واژه‌ای ظاهراً ساده نقش محوری داشته باشد، گراف می‌تواند آن را برجسته کند. اگر چند مفهوم در ظاهر دور از هم باشند اما در متن به هم وصل شده باشند، این پروژه می‌تواند این اتصال را پیدا کند.

نتیجه برای کاربر عادی ساده است:
پاسخ‌ها دقیق‌تر، قابل فهم‌تر و قابل اعتمادتر می‌شوند.

Rakhshai Graph-based NLP برای تیم فنی چه ارزشی دارد؟

برای تیم فنی، MCP Support یعنی Rakhshai Graph-based NLP می‌تواند به‌عنوان یک سرویس قابل فراخوانی در کنار مدل‌های زبانی، Agentها و workflowهای هوشمند قرار بگیرد. ابزارهایی مانند rakhshai_analyze_persian_text، rakhshai_build_knowledge_graph، rakhshai_graph_summarize، rakhshai_graph_memory_generate، rakhshai_explain_result و rakhshai_optimize_persian_prompt برای این لایه تعریف شده‌اند.

این یعنی توسعه‌دهنده می‌تواند یک Agent فارسی بسازد که قبل از پاسخ دادن، متن را با Rakhshai Graph-based NLP تحلیل کند، گراف بسازد، شواهد مرتبط را بازیابی کند و بعد پاسخ نهایی را با اتکا به همان شواهد تولید کند.

از طرف دیگر، Rakhshai Graph-based NLP در نسخه جدید خود مسیر Graph-LM فارسی، Graph Memory، Adaptive Graph-Text Fusion، موتور آموزش برای داده کم و معماری Transformer decoder مدرن را هم معرفی کرده است؛ یعنی نگاه ما فقط به تحلیل کلاسیک متن محدود نیست و به سمت مدل‌سازی زبانی گراف‌محور فارسی حرکت می‌کنیم .

امنیت و کنترل‌پذیری؛ نکته‌ای که نباید نادیده گرفت

یکی از نقاط مثبت طراحی MCP در پروژه ما این است که در نسخه اول، قابلیت‌های پرخطر مثل اجرای shell، حذف فایل، نصب پکیج، آموزش مستقیم یا نوشتن arbitrary در اختیار MCP client قرار نگرفته‌اند. منابع مدل، گراف و اجراها read-only و محدود به مسیرهای whitelist شده‌اند. این نوع طراحی برای استفاده سازمانی مهم است؛ چون اتصال هوش مصنوعی به ابزارها بدون کنترل امنیتی می‌تواند خطرناک باشد. (raw.githubusercontent.com)

به بیان ساده، Rakhshai Graph-based NLP تلاش می‌کند قدرت اتصال به Agentها را با کنترل، محدودیت و توضیح‌پذیری همراه کند.

جمع‌بندی

Rakhshai Graph-based NLP با پشتیبانی MCP یک قدم مهم برای هوش مصنوعی فارسی است. این محصول به مدل‌ها کمک می‌کند متن فارسی را نه فقط به‌صورت خطی، بلکه به شکل شبکه‌ای از مفهوم‌ها، رابطه‌ها و شواهد ببینند. نتیجه، تحلیلی است که می‌تواند دقیق‌تر، قابل توضیح‌تر و کاربردی‌تر باشد.

«چهار برابر تحلیل فارسی قوی‌تر» فقط یک شعار تبلیغاتی نیست؛ پشت آن یک ایده روشن قرار دارد:
وقتی مدل هوش مصنوعی به شواهد گرافی Rakhshai Graph-based NLP مجهز می‌شود، فارسی را با چشم بازتری می‌خواند.

Rakhshai Graph-based NLP برای آینده‌ای ساخته شده که در آن Agentهای فارسی‌زبان، چت‌بات‌های سازمانی، ابزارهای تحلیل متن، سامانه‌های هوشمند و مدل‌های زبانی، به جای پاسخ‌های مبهم و حدسی، پاسخ‌هایی مستند، قابل پیگیری و متکی بر ساختار واقعی متن ارائه می‌دهند.