زبان فارسی فقط مجموعهای از کلمهها نیست. هر جمله فارسی، مخصوصاً در متنهای ادبی، خبری، حقوقی، پزشکی، شبکههای اجتماعی یا محتوای سازمانی، پر از رابطههای پنهان است؛ رابطه میان واژهها، نقشها، مفهومها، اشارهها، نشانهها و حتی سکوتهایی که در متن حضور دارند. بسیاری از مدلهای هوش مصنوعی متن را خوب میخوانند، اما همیشه نمیدانند کدام بخش متن مهمتر است، کدام واژهها به هم وصلاند و چرا یک نتیجه خاص گرفته شده است.
دشواری اصلی تحلیل فارسی چیست؟
وقتی یک انسان متن فارسی را میخواند، فقط کلمهها را پشت سر هم نمیبیند. مثلاً در یک شعر، «آینه»، «سایه»، «چراغ»، «رود»، «تشنگی»، «خانه» و «کلید» فقط چند واژه جدا نیستند؛ هرکدام بخشی از یک شبکه معناییاند. در متنهای سازمانی هم همین است: نام افراد، رویدادها، اسناد، نیتها، زمانها، هشدارها و نشانهها به هم وصلاند.
مدلهای زبانی معمولی معمولاً متن را بهصورت دنبالهای از توکنها پردازش میکنند. این روش قدرتمند است، اما همیشه برای فارسی کافی نیست؛ چون فارسی زبانی پر از وابستگیهای نحوی، معناهای ضمنی، حذف، ایهام، ترکیبهای استعاری و رابطههای غیرمستقیم است.
Rakhshai Graph-based NLP این مسئله را برای متن ها با زبان فارسی از زاویهای متفاوت حل میکند: متن فارسی را به گراف تبدیل میکند. یعنی به جای اینکه فقط بپرسد «بعد از این کلمه چه میآید؟»، میپرسد:
این کلمه به چه مفاهیمی وصل است؟ کدام رابطهها مهمترند؟ کدام مسیر معنایی به نتیجه بهتر میرسد؟
این مقاله پیرامون قابلیت mcp پروژه است که در تاریخ زیر منتشر شده :
میلادی: پنجشنبه، ۲ جولای ۲۰۲۶
خورشیدی: پنجشنبه، ۱۱ تیر ۱۴۰۵
لینک پروژه متن باز Rakhshai Graph-based NLP :
MCP چه چیزی به پروژه متن باز Rakhshai Graph-based NLP اضافه میکند؟
هدف اصلی ما ساخت یک زیرساخت ایرانی برای پردازش عمیق متن فارسی بوده است. رخشای تلاش میکند متن فارسی را با تکیه بر ساختارهای گرافی، حافظه گرافی، تحلیل معنایی و مدلسازی بومی زبان، به شکلی دقیقتر و قابل توضیحتر درک کند و در مسیر توسعه خود به سمت تولید مدل ایرانی پردازش متن فارسی حرکت میکند. پشتیبانی از MCP بخشی از قدرت این پروژه است، نه تمام آن؛ MCP به رخشای کمک میکند تواناییهای خود را در اختیار Agentها، چتباتها و مدلهای مطرح هوش مصنوعی قرار دهد، اما هسته اصلی پروژه همچنان بر توسعه فناوری بومی برای زبان فارسی استوار است.
ما Rakhshai Graph-based NLP را برای این ساختهایم که فارسی فقط مصرفکننده مدلهای عمومی نباشد، بلکه خودش صاحب مدل، حافظه، گراف دانشی و ابزار تحلیل مستقل باشد؛ مدلی ایرانی که بتواند متن فارسی را با منطق و ظرافت خود زبان فارسی بفهمد، تحلیل کند و توضیح دهد.
قابلیت جدید MCP Support باعث میشود این کتابخانه فقط یک کتابخانه پردازش متن نباشد، بلکه به یک لایه قابل اتصال برای Agentها، چتباتها، IDEها، ابزارهای توسعه و مدلهای بیرونی تبدیل شود. خود MCP یا Model Context Protocol یک استاندارد متنباز برای اتصال برنامههای هوش مصنوعی به ابزارها، دادهها و workflowهای بیرونی است؛ میتوان MCP از آن بهعنوان چیزی شبیه «USB-C برای اپلیکیشنهای هوش مصنوعی» یاد کرد.
به زبان ساده، MCP در این پروژه کاری میکند که یک مدل هوش مصنوعی بتواند بهجای حدسزدن، از ابزار تخصصی کمک بگیرد. در اینجا، ابزار تخصصی همان Rakhshai Graph-based NLP است؛ ابزاری که متن فارسی را تحلیل میکند، گراف میسازد، مفاهیم مهم را بیرون میکشد، رابطهها را نشان میدهد و به مدل میگوید:
برای پاسخ دادن، این شواهد را هم ببین.
از تحلیل ساده تا تحلیل قابل توضیح برای زبان فارسی
تفاوت مهم Rakhshai Graph-based NLP با بسیاری از روشهای معمول این است که خروجی آن فقط یک جواب نهایی نیست. این پروژه میتواند نشان دهد کدام گرهها، رابطهها و مسیرهای استدلالی در تحلیل نقش داشتهاند. در مستندات MCP پروژه، ابزارهایی مثل تحلیل متن فارسی، ساخت گراف دانشی، خلاصهسازی گرافمحور، تولید پاسخ با Graph Memory، توضیح خروجی با گرهها و رابطهها، و بهینهسازی پرامپت فارسی معرفی شدهاند.
این موضوع برای مخاطب عمومی یعنی اعتماد بیشتر. وقتی سیستم میگوید یک متن درباره نگرانی، هشدار، تهدید، احساس منفی یا یک مفهوم خاص است، میتوان پرسید: «چرا؟» و این روش میتواند مسیر را نشان دهد.
برای تیمهای فنی هم این یعنی خروجی فقط black box نیست. در معماری MCP پروژه، مسیر کلی به این شکل طراحی شده است:
متن فارسی وارد میشود، به گراف دانشی تبدیل میشود، استدلال گرافی و Graph Memory روی آن عمل میکنند و در نهایت خروجی قابل توضیح تولید میشود.
چهار برابر قویتر؛ این عدد دقیقاً یعنی چه؟
تیتر «چهار برابر تحلیل فارسی قویتر» جذاب است، اما باید درست و شفاف توضیح داده شود. طبق گزارش تست تکنمونهای پروژه، اتصال Rakhshai Graph-based NLP MCP به مدل بیرونی در تحلیل یک شعر فارسی (به عنوان نمونه ای که مدل های بزرگ زبانی سخت میتوانند مفهوم آن را درک کنند) باعث شد تعداد استفادههای مؤثر از شواهد معنایی از ۱ به ۴ برسد؛ یعنی از نظر استفاده از شواهد معنایی پنهان در پاسخ، خروجی ۴ برابر قویتر شد. در همان گزارش، امتیاز کلی تحلیل نیز از ۲۱ به ۲۵ رسید؛ یعنی حدود ۱۹٪ بهبود در کیفیت کلی پاسخ (درک عمومی سوال) نسبت به حالت direct گزارش شده است .
این نکته مهم است: این عدد یک ادعای عمومی برای همه متنها و همه مدلها نیست؛ بلکه نتیجه یک تست مشخص روی یک نمونه شعر فارسی است که قابلیت تکرار توسط کاربر را هم دارد . اما همین تست نشان میدهد وقتی مدل هوش مصنوعی بهجای تحلیل تنها، از شواهد افزوده پروژه کمک میگیرد، پاسخ میتواند دقیقتر، مستندتر و قابل توضیحتر شود.
متن شعری که برای تست استفاده شده : (به دلیل درک سخت مفاهیم پنهان شعر در زبان فارسی – شعر برای نمونه تست استفاده شده است .)
در آینه، سایهام از من قدیمیتر بود
و نامم از دهانِ پنجره به باران میریخت
چراغی که خوابِ خاکستر میدید
راه را به پای گمشدهام نشان نمیداد
رود از کنار من گذشت
اما تشنگی در مشتهایم لانه کرده بود
گفتم: کدام سو خانه است؟
باد، کلیدی زنگزده را در سکوت چرخاند
تست اجرایی
| ردیف | نام مدل تستشده | شرکت سازنده / ارائهدهنده | نقش در تست | تنظیمات اصلی تست |
|---|---|---|---|---|
| ۱ | gpt-5.4 | OpenAI | مدل بیرونی برای مقایسه دو حالت پاسخگویی: مستقیم و متصل به Rakhshai MCP | temperature=0، top_p=1، max_output_tokens=3000، seed=42 درخواست شد؛ تست بدون seed ولی با شرایط یکسان تکرار شد. |
| حالت تست | سوال / درخواست ارسالشده به API | تفاوت اصلی در ورودی | خلاصه پاسخ دریافتی | نتیجه ارزیابی |
|---|---|---|---|---|
| حالت A — پاسخ مستقیم / Direct | «به این سوال درباره شعر پاسخ بده. سوال: این شعر از دید تو چه معنی میدهد؟ معنی اصلی شعر را ساده توضیح بده و بگو رابطه میان آینه، سایه، نام، چراغ، رود، تشنگی، خانه و کلید چیست؟» سپس متن کامل شعر ارسال شده است. | مدل فقط خود شعر و سوال کاربر را دریافت کرده؛ هیچ شواهد گرافی از رخشای به آن داده نشده است. | پاسخ، شعر را درباره گمگشتگی، بحران هویت، نرسیدن به آرامش و جستوجوی خانه واقعی تفسیر کرده است. همچنین نمادها را جداگانه توضیح داده: آینه برای خودشناسی، سایه برای گذشته یا بخش پنهان وجود، نام برای هویت، چراغ برای راهنمایی، رود برای امکان نجات، تشنگی برای نیاز درونی، خانه برای آرامش و کلید برای راهحل یا ورود. | امتیاز دستی: 21 از ۲۵. تعداد استفاده مؤثر از شواهد: 1. سیگنال توضیحپذیری گرافی: نداشت. |
| حالت B — متصل به Rakhshai MCP | همان سوال و همان شعر ارسال شده، اما این جمله هم به درخواست اضافه شده است: «از شواهد گرافی Rakhshai MCP فقط وقتی استفاده کن که مرتبط است. در پاسخ توضیح بده کدام گرهها یا رابطهها کمک کردند.» سپس خروجی تحلیلی رخشای شامل گرهها، رابطهها، مسیرهای استدلالی و Graph Memory هم به ورودی اضافه شده است. | مدل علاوه بر شعر، شواهد گرافی رخشای را هم دریافت کرده؛ مثل گرههای مهم گمشدهام، خواب، سو، کلیدی، دهان، خانه و رابطههایی مثل دهان ↔ پنجره، باران ↔ میریخت و خواب ↔ خاکستر. | پاسخ، همان مضمون اصلی را دقیقتر و مستندتر توضیح داده: بحران هویت، گمکردن راه، جستوجوی خانه، و وجود نشانههای نجات در کنار ناتوانی در رسیدن به آنها. تفاوت مهم این پاسخ این بود که در پایان توضیح داد کدام گرهها و رابطههای گرافی باعث تقویت تحلیل شدهاند؛ مثلاً گره گمشدهام برای گمگشتگی، خانه و کلیدی برای مسئله رسیدن و گشودن، و رابطه خواب ↔ خاکستر برای خاموشی چراغ. | امتیاز دستی: 25 از ۲۵. تعداد استفاده مؤثر از شواهد: 4. سیگنال توضیحپذیری گرافی: داشت. بهبود کلی نسبت به حالت مستقیم: حدود 19٪. بهبود در استفاده از شواهد: 4x. |
چرا این برای اکو سیستم زبان فارسی در مدل های هوش مصنوعی مهم است؟
اکو سیستم زبان فارسی در مدل های هوش مصنوعی به ابزارهایی نیاز دارد که فقط ترجمهشده یا تقلیدی از مدلهای انگلیسی نباشند. فارسی ساختار، نشانهها و پیچیدگیهای خودش را دارد. Rakhshai Graph-based NLP از ابتدا برای متن فارسی طراحی شده است: از پیشپردازش و توکنسازی فارسی تا ساخت گرافهای همرخدادی، نحوی، معنایی، واژه-سند و حافظه گرافی و ساخت مدل .
این یعنی محصول میتواند در سناریوهای واقعی استفاده شود: تحلیل بازخورد مشتریان، طبقهبندی خبر، پایش شبکههای اجتماعی، خلاصهسازی اسناد، تحلیل محتوای فارسی، ساخت چتبات تخصصی، تحلیل شعر و ادبیات، استخراج مفهوم از گزارشها و ایجاد Agentهای فارسیزبان.
Rakhshai Graph-based NLP برای کاربر غیرتخصصی چه ارزشی دارد؟
برای کاربر عمومی، این پروژه یعنی هوش مصنوعیای که فارسی را سطحی نمیخواند. یعنی وقتی متنی را تحلیل میکند، فقط چند کلمه کلیدی تحویل نمیدهد؛ رابطهها را هم میبیند. اگر در یک متن، واژهای ظاهراً ساده نقش محوری داشته باشد، گراف میتواند آن را برجسته کند. اگر چند مفهوم در ظاهر دور از هم باشند اما در متن به هم وصل شده باشند، این پروژه میتواند این اتصال را پیدا کند.
نتیجه برای کاربر عادی ساده است:
پاسخها دقیقتر، قابل فهمتر و قابل اعتمادتر میشوند.
Rakhshai Graph-based NLP برای تیم فنی چه ارزشی دارد؟
برای تیم فنی، MCP Support یعنی Rakhshai Graph-based NLP میتواند بهعنوان یک سرویس قابل فراخوانی در کنار مدلهای زبانی، Agentها و workflowهای هوشمند قرار بگیرد. ابزارهایی مانند rakhshai_analyze_persian_text، rakhshai_build_knowledge_graph، rakhshai_graph_summarize، rakhshai_graph_memory_generate، rakhshai_explain_result و rakhshai_optimize_persian_prompt برای این لایه تعریف شدهاند.
این یعنی توسعهدهنده میتواند یک Agent فارسی بسازد که قبل از پاسخ دادن، متن را با Rakhshai Graph-based NLP تحلیل کند، گراف بسازد، شواهد مرتبط را بازیابی کند و بعد پاسخ نهایی را با اتکا به همان شواهد تولید کند.
از طرف دیگر، Rakhshai Graph-based NLP در نسخه جدید خود مسیر Graph-LM فارسی، Graph Memory، Adaptive Graph-Text Fusion، موتور آموزش برای داده کم و معماری Transformer decoder مدرن را هم معرفی کرده است؛ یعنی نگاه ما فقط به تحلیل کلاسیک متن محدود نیست و به سمت مدلسازی زبانی گرافمحور فارسی حرکت میکنیم .
امنیت و کنترلپذیری؛ نکتهای که نباید نادیده گرفت
یکی از نقاط مثبت طراحی MCP در پروژه ما این است که در نسخه اول، قابلیتهای پرخطر مثل اجرای shell، حذف فایل، نصب پکیج، آموزش مستقیم یا نوشتن arbitrary در اختیار MCP client قرار نگرفتهاند. منابع مدل، گراف و اجراها read-only و محدود به مسیرهای whitelist شدهاند. این نوع طراحی برای استفاده سازمانی مهم است؛ چون اتصال هوش مصنوعی به ابزارها بدون کنترل امنیتی میتواند خطرناک باشد. (raw.githubusercontent.com)
به بیان ساده، Rakhshai Graph-based NLP تلاش میکند قدرت اتصال به Agentها را با کنترل، محدودیت و توضیحپذیری همراه کند.
جمعبندی
Rakhshai Graph-based NLP با پشتیبانی MCP یک قدم مهم برای هوش مصنوعی فارسی است. این محصول به مدلها کمک میکند متن فارسی را نه فقط بهصورت خطی، بلکه به شکل شبکهای از مفهومها، رابطهها و شواهد ببینند. نتیجه، تحلیلی است که میتواند دقیقتر، قابل توضیحتر و کاربردیتر باشد.
«چهار برابر تحلیل فارسی قویتر» فقط یک شعار تبلیغاتی نیست؛ پشت آن یک ایده روشن قرار دارد:
وقتی مدل هوش مصنوعی به شواهد گرافی Rakhshai Graph-based NLP مجهز میشود، فارسی را با چشم بازتری میخواند.
Rakhshai Graph-based NLP برای آیندهای ساخته شده که در آن Agentهای فارسیزبان، چتباتهای سازمانی، ابزارهای تحلیل متن، سامانههای هوشمند و مدلهای زبانی، به جای پاسخهای مبهم و حدسی، پاسخهایی مستند، قابل پیگیری و متکی بر ساختار واقعی متن ارائه میدهند.