🏆 DOMAIN_MODEL_RANKINGS.md — أفضل نموذج لكل مجال
> مرجع إلزامي قبل أي مهمة تخصصية.
> يُحدَّث أسبوعياً عبر weekly_arsenal_audit.sh (يوم الأحد 05:00 الكويت).
> يُفحص في startup عبر verify_agreements.sh section 10.
>
> القاعدة الذهبية: الأفضل دائماً → ثم بديل أرخص بنفس الجودة → fallback chain لا تتوقف أبداً.
> آخر تحديث يدوي: 2026-05-20 16:00 GMT+2 · آخر audit آلي: راجع memory/arsenal-audit-state.json
---
🌐 إطار الاختيار (في كل مجال)
1. Best in the world (regardless of cost)
2. هل عندنا بديل في النظام بنفس الجودة؟ → استخدمه (وفر الجديد)
3. هل في بديل مجاني خارجي؟ → خذه (وفر المدفوع)
4. أرخص مدفوع يعطي نفس الجودة → آخر خيار
5. عند أي فشل → التالي في القائمة فوراً، لا توقف
---
📊 المصفوفة الشاملة
1️⃣ Text/Chat (General Conversation + Reasoning) — محدّث 2026-05-30 (Opus 4.8 released by Anthropic 2026-05-28)
| الترتيب | النموذج | السياق | السعر/M | نقاط القوة |
|---|---|---|---|---|
| 1 | Claude Opus 4.8 (Anthropic Direct) ← PRIMARY (2026-05-30) claude-opus-4-8 | 1M | $5/$25 | أحدث + Improved coding/knowledge work (Anthropic 2026-05-28) |
| 2 | Claude Opus 4.7 (Anthropic Direct) claude-opus-4-7 | 1M | $15/M | سابق PRIMARY — أعلى جودة + استقرار |
| 3 | ChatGPT 5.5 Pro / 5.5 Direct | 400K | $5/M | OpenAI direct — أحدث |
| 4 | Gemini 3.1 Pro Preview | 1M | $1.25/M | سياق كبير + multimodal |
| 5 | Qwen 3.7 Max (via MuleRouter) mulerouter/qwen3.7-max | 262K | MuleRouter | #4-5 عالمياً (AA Intelligence Index 57) — أضيف 2026-06-04 |
| 6 | Grok 4.3 | 256K | $3/M | xAI، تحديث الأخبار |
| 7 | Gemini 3.5 Flash | 1M | مجاني (KW) | الأحدث، سريع جداً |
| 8 | Claude Opus 4.6 | 1M | $15/M | بديل Opus |
| 9 | Claude Sonnet 4.6 | 1M | $3/M | جودة + رخيص |
| 10 | Kimi K2.6 | 200K | رخيص | Moonshot |
| 11 | DeepSeek V4 Pro | 128K | $0.14/M | الأرخص الذكي |
Auto-Route by Context: دائماً Opus Direct (1M) → compaction عند 850K → fallback chain. Nexos أُزيل من الترتيب التلقائي (M-027 + 2026-05-28). يدوي فقط عبر NEXOS_API_KEY عند طلب صريح بالنص.
---
2️⃣ Image Generation — Artificial Analysis Arena (Live, 2026-05-21)
2.1 Text → Image (Top 12 Global)
| # | الموديل | Provider | Elo | $/1K | عندنا؟ |
|---|---|---|---|---|---|
| 1 | GPT Image 2 (high) | OpenAI | 1338 | $211 | ✅ openai/gpt-image-2 |
| 2 | GPT Image 1.5 (high) | OpenAI | 1265 | $133 | ✅ |
| 3 | Nano Banana 2 | Google (3.1 Flash Image) | 1263 | $67 ⭐ | ✅ gemini-3.1-flash-image-preview |
| 4 | Nano Banana Pro | Google (3 Pro Image) | 1221 | $134 | ✅ |
| 5 | MAI-Image-2 | Microsoft | 1196 | $50 | ❌ (Bing only) |
| 6 | FLUX.2 [max] | Black Forest | 1196 | $70 | ✅ via Replicate |
| 7 | Seedream 4.0 | ByteDance | 1194 | $30 | ✅ via fal |
| 8 | FLUX.2 [pro] | Black Forest | 1186 | $30 | ✅ |
| 9 | HiDream-O1-Image-Dev-2604 | HiDream | 1183 | Open | — |
| 10 | grok-imagine-image | xAI | 1180 | $20 ⭐⭐ | ✅ xai/grok-imagine-image |
| 11 | ImagineArt 2.0 | ImagineArt | 1177 | $30 | — |
| 12 | Imagen 4 Ultra | Google | 1170 | $60 | ✅ (US region) |
2.2 Image → Image (محاكاة الصور الحقيقية + التحرير) Top 10
| # | الموديل | Provider | Elo | $/1K | عندنا؟ | |---|---|---|---|---|---| | 1 | GPT Image 1.5 (high) | OpenAI | 1265 | $133 | ✅ | | 2 | GPT Image 2 (high) | OpenAI | 1253 | $211 | ✅ | | 3 | Nano Banana Pro | Google | 1240 | $134 | ✅ | | 4 | Nano Banana 2 | Google | 1235 | $67 ⭐ | ✅ | | 5 | HunyuanImage 3.0 Instruct | Tencent | 1223 | $90 | ✅ via Fal | | 6 | grok-imagine-image | xAI | 1214 | $20 ⭐⭐ الأرخص | ✅ | | 7 | HiDream-O1-Image | HiDream | 1213 | $40 | Open | | 8 | Kling Image 3.0 Omni | KlingAI | 1208 | coming | — | | 9 | FLUX.2 [max] | Black Forest | 1205 | $140 | ✅ | | 10 | Wan 2.7 Pro | Alibaba | 1202 | coming | — |
2.3 Use-case Mapping (الخلاصة)
| المهمة | الأفضل | البديل ذكي ($) | البديل المجاني | |---|---|---|---| | Face accuracy (family, real people) | GPT-image-2 ($0.21/img) | Nano Banana 2 ($0.067/img) | — | | Photorealistic from text | GPT-image-2 | Nano Banana 2 | grok-imagine-image ($0.02) | | Edit real photo (background, retouch, swap) | GPT Image 1.5 | Nano Banana 2 | grok-imagine-image | | Ultrawide / Large Print | Imagen 4 Ultra | GPT-image-2 | FLUX.2 [max] | | Speed/quick draft | Nano Banana 2 | Imagen 4 Fast | grok-imagine-image | | Artistic/stylized | Grok Imagine Quality | FLUX.2 [max] | Seedream 4.5 | | Logo/icon | GPT-image-2 | Recraft V4 Pro | Nano Banana 2 | | Text rendering in image | GPT-image-2 | Nano Banana Pro | Ideogram 3.0 | | Open-weight self-host | HiDream-O1-Image-Dev | FLUX.2 [dev] | Z-Image Turbo |
Config: imageGenerationModel.primary = openai/gpt-image-2 ✅
Fallbacks (مُعاد ترتيبها 2026-06-04 حسب Arena يونيو 2026 — الأقوى→الأضعف + تنويع مزوّدين):
1. google/gemini-3.1-flash-image-preview (Nano Banana 2 — #2 عالمياً T2I 1271 / Edit 1387)
2. google/gemini-3-pro-image-preview (Nano Banana Pro — #3-6)
3. openai/gpt-image-1.5 (#4-5 T2I 1241 / Edit 1374 — نفس مزوّد redundancy)
4. xai/grok-imagine-image-quality (#5 Edit 1388 — مزوّد مختلف = أمان)
5. black-forest-labs/flux-2-pro (قوي/رخيص)
6. minimax/image-01 (bulk رخيص — ليس للوجوه)
7. fal/fal-ai/flux/dev (مجاني احتياطي)
سابقاً (مُلغى): كان #2 = fal/fal-ai/qwen-image (Elo ~1115 ضعيف) — أُزيل لأنه أضعف بـ156 نقطة Elo من Nano Banana 2. mediaGenerationAutoProviderFallback=true يُلحق مزوّدين إضافيين auto = طبقة never-stop. للوجوه الحقيقية: GPT Image 2 (Edit Elo 1467 #1 عالمياً) حصراً ثم Nano Banana Pro/2.القاعدة الذهبية للصور: للوجوه الحقيقية لعائلة د. وائل = GPT Image 2 (لا تنازل). للمهام الأخرى، Nano Banana 2 يقدم 91% من جودة GPT بـ 32% من السعر — best value.
---
3️⃣ Video Generation — مفصّل بـ 4 أبعاد (محدّث 2026-05-20 19:15 — Artificial Analysis Arena)
> مرجع البنشمارك: Artificial Analysis Text-to-Video + Image-to-Video Leaderboards (مايو 2026) > القاعدة: الأفضل عالمياً → بديل عندنا بنفس الجودة → مجاني → أرخص مدفوع
3.1 Text → Video (سينمائي + صوت)
| الترتيب | الموديل | Elo | السعر/min | تعليق | |---|---|---|---|---| | PRIMARY | Veo 3.1 (Google) | 1095 | $24.00 | 4K + audio native — الأفضل في فئته | | #2 | Veo 3.1 Fast | 1091 | $9.00 | نفس الجودة، أرخص 62% | | #3 | Kling 3.0 Omni 1080p Pro | 1098 | $16.80 | متاح عبر fal.ai أو PiAPI 🆕 | | #4 | Sora 2 Pro | 1075 | $30.00 | للسرديّات المعقدة | | #5 | Sora 2 (December) | 1083 | $6.00 | جودة Pro بسعر معقول | | #6 | Runway Gen-4.5 | — | API maturity | للـ director-style control 🔄 (محدّث من Gen-4) | | #7 | Vidu Q3 Pro | 1078 | $9.60 | 🆕 | | #8 | Hailuo 2.3 | — | رخيص | 🔄 (محدّث من Hailuo 02) | | #9 | Seedance 1.5 Pro | 1000 | $11.86 | متاح | | #10 | PixVerse V6 | 1067 | $6.90 | budget option 🆕 | | #11 | Veo 3.1 Lite | 1074 | $4.80 | أرخص Veo | | #12 | LTX-2.3 Pro (open weights) | 958 | $2.40-3.60 | الأرخص في top-20 🆕 — #1 open-weights مع audio (AA Arena) |
Watch (لا API بعد): Seedance 2.0 (Elo 1212 #1) · HappyHorse-1.0 (1209 #2) — مراقبة أسبوعية
> 💰 Budget video pipeline (توفير مقابل Veo — مُعتمد 2026-06-07): لمشاهد لا تحتاج جودة Veo السينمائية، الفكرة الأعمق (أقرّها د. وائل): ولّد الفيديو صامتاً بطبقة budget ثم ركّب صوت OpenAI gpt-audio (TTS/realtime) عبر media-editing-arsenal/media_edit.py — أرخص بكثير من Veo native audio.
>
> 🏆 دراسة LTX-2.3 — rank عالمي + تكلفة (verified live 2026-06-07, Artificial Analysis Arena):
> - Text-to-Video (with audio): LTX-2.3 Fast = Elo 974 — #1 بين open-weights فقط، لكن ~360-410 نقطة تحت Veo 3.1 (~1213-1386). عالمياً ≈ #11-12.
> - Image-to-Video (with audio): LTX-2.3 Pro = Elo 955 — #1 open-weights.
> - التكلفة: Fast 720p ~$0.03/sec · Fast 1080p ~$0.05 · Pro 720p ~$0.06 · Pro 1080p ~$0.10/sec. open-weights مجاني محلياً (يحتاج GPU).
>
> ✅ التوصية النهائية (بعد الفحص): لا ندمج LTX-2.3 كطبقة budget الآن. السبب: ترسانتنا تملك بدائل budget أقوى Elo + موصولة فوراً بأداة video_generate: Grok Imagine ($4.20/min، Elo 1093) للـ I2V · Hailuo 2.3 Fast / Seedance 2.0 fast للتجربة الرخيصة. LTX أرخص نظرياً لكن أضعف جودة + غير موصول + سيرفرنا CPU لا يشغّله محلياً.
>
> 👁️ Watch-list فقط: LTX-2.3 يستحق الإضافة فقط لسيناريو "تشغيل محلي مجاني 100% لبيانات حساسة" على GPD Win Max 2 (Radeon 890M) — مثل قاعدة Ollama للنصوص.
>
> القاعدة المُعتمدة: القمة = Veo 3.1 · budget = Grok Imagine + Hailuo/Seedance · LTX = watch-list (محلي/GPD فقط). فكرة silent-video + OpenAI gpt-audio تبقى صالحة لأي طبقة budget لتوفير Veo native audio.
3.2 Image → Video (🚨 ترتيب مختلف!)
| الترتيب | الموديل | Elo | السعر/min | تعليق | |---|---|---|---|---| | PRIMARY | 🔥 Grok Imagine Video (xAI) | 1093 | $4.20 | #3 عالمياً، متفوق على Veo 3.1 نفسه! الأرخص في القمة ⭐ | | #2 | Veo 3.1 Fast | 1091 | $9.00 | بديل قوي | | #3 | Veo 3.1 | 1085 | $24.00 | جودة أعلى لكن أغلى | | #4 | PixVerse V6 | 1081 | $6.90 | 🆕 | | #5 | Kling 3.0 1080p Pro | 1080 | $20.16 | 🆕 | | #6 | Kling 3.0 Omni 1080p | 1067 | $16.80 | 🆕 | | #7 | Veo 3.1 Lite | 1063 | $4.80 | أرخص | | #8 | Vidu Q3 Pro | 1059 | $9.60 | 🆕 | | #9 | Seedance 1.5 Pro | 1000 | $11.86 | متاح |
3.3 Talking Avatar (محاكي الأشخاص الحقيقيين)
| الحالة | الأفضل | البديل |
|---|---|---|
| Wael Digital Twin | HeyGen Custom Avatar c6a8b1b1 + ElevenLabs WAEL HD v2 (sTJJWD3ns4Cr4Ag6Rb8G) | Hedra Character 3 + ElevenLabs |
| Talking head شخص آخر | HeyGen Custom Avatar (من 2-min فيديو) + ElevenLabs voice clone | Hedra Character 3 |
| صورة فقط → talking | HeyGen Photo Avatar IV | Hedra Character 3 |
| Corporate enterprise | HeyGen (300+ langs) | Synthesia (140 langs, Avatar IV — alternative، لا نشتري إلا للضرورة) |
| تجربة سريعة مجانية | Hedra Free Trial | — |
القاعدة لـ Avatars: HeyGen يغطي 99% من use cases → لا نشتري Synthesia إلا لو احتجنا feature خاص (enterprise LMS مثلاً). Hedra مجاني trial = backup ممتاز.
3.4 خاصة (Cinematic Camera / Editing / Lip-Sync Arabic)
| المهمة | الأفضل | البديل | |---|---|---| | حركة كاميرا سينمائية | Higgsfield DoP-2 | Runway Gen-4.5 | | تحرير فيديو موجود | Runway Aleph | Higgsfield | | Arabic Lip-Sync | HeyGen + ElevenLabs v3 (stack) | Synthesia (corporate fallback) | | Vision verify قبل الإرسال | Claude Opus 4.7 Vision أو Gemini 3.1 Pro | إلزامي 100% (M-XER protocol) |
Config: videoGenerationModel.primary = google/veo-3.1-generate-preview (للـ text→video)
Fallbacks: veo-fast → sora-2-pro → sora-2 → kling-3-omni 🆕 → grok-imagine-video 🆕 → runway-gen4.5 → hailuo-2.3 → seedance → vidu-q3-pro 🆕 → pixverse-v6 🆕 → ltx-2.3-pro 🆕 → wan-2.7
Note: Text→Video يستخدم حساب الـ US لأنه أسرع بـ 22% لـ Veo. Image→Video يستخدم Grok Imagine PRIMARY (مش Veo) — استدعِ xai/grok-imagine-video مباشرة عند image input
---
4️⃣ Music Generation (محدّث 2026-05-24 — ElevenMusic API دخل السوق)
| المهمة | 🥇 الأفضل | 🥈 البديل #1 | 🥉 البديل #2 (رخيص/مجاني) | |---|---|---|---| | سينمائي + موسيقى احترافية | Google Lyria 3 Pro Preview | ElevenMusic API 🆕 (Apr 2026) | MiniMax Music 2.6 (Limited FREE ⭐) | | Lyrics + غناء | Lyria 3 Pro | ElevenMusic 🆕 (vocal SOTA) | MiniMax Music 2.6 | | Cover versions (من صوت مرجعي) | MiniMax Music-Cover 🆕 | ElevenMusic remix | — | | Instrumental فقط | Lyria 3 Pro Instrumental | ElevenMusic instrumental | MiniMax Music 2.5+ | | Short Clips (~30s) | Lyria 3 Clip Preview | ElevenMusic | MiniMax Music 2.6 | | Lyrics text generation | MiniMax Lyrics ($0.01/song FREE ⭐) | Claude Opus 4.7 | — | | Batch/cheap | MiniMax Music 2.0 ($0.03/5min) | Music 2.5+ | — |
Config: musicGenerationModel.primary = google/lyria-3-pro-preview ✅
🆕 ElevenMusic (Apr 29, 2026): أول دخول لـ ElevenLabs لتوليد الموسيقى — متاح عبر /v1/music على ELEVENLABS_API_KEY الحالي. مرشّح ليصبح SOTA للأصوات الغنائية.
🆕 Music-2.6 (Apr 10, 2026): Limited FREE · Cover Reborn + Bass Redefined · بديل صفري التكلفة لـ Lyria في المهام العائلية.
---
5️⃣ Voice (TTS) — محدّث 2026-05-24 (أضيف MiniMax Speech 2.6 + Eleven Text-to-Dialogue)
4 موديلات ElevenLabs + 3 MiniMax — Auto-Route حسب طول النص + نوع الاستخدام:
| Model | اللغات | Max Chars | التعبير | Finetune | الاستخدام |
|---|---|---|---|---|---|
| eleven_v3 ← PRIMARY | 74 (عربي ✅) | 5,000 | ✨ most expressive | ❌ | جودة أعلى للنصوص ≤5K حرف |
| eleven_text_to_dialogue 🆕 | 70+ | — | 🎭 multi-speaker | ❌ | حوارات، بودكاست، قصص متعددة الأصوات |
| eleven_multilingual_v2 | 29 (عربي ✅) | 10,000 | غني جداً | ✅ | نصوص متوسطة/طويلة + audiobook |
| eleven_flash_v2_5 | 32 (عربي ✅) | 40,000 | جيد | ✅ | سرعة عالية + نصوص طويلة |
| MiniMax speech-2.8-hd | 40 | — | عالي + 7 emotions | ✅ Clone | بديل رخيص 70% للطويل |
| MiniMax speech-2.6 🆕 (Mar 2026) | 40 | — | جيد | — | ultra-low latency للـ chat realtime |
| MiniMax speech-2.8-turbo | 40 | — | جيد | — | أرخص دفعات (audiobook) |
Auto-Route Logic (مكتوبة في skill):
text length ≤ 5,000 → eleven_v3 (جودة أعلى + 74 لغة)
5,000 < text ≤ 10,000 → eleven_multilingual_v2 (تعبير غني)
text > 10,000 → eleven_flash_v2_5 أو chunking لـ v3
latency-critical chat → eleven_flash_v2_5
| المهمة | الأفضل | البديل | |---|---|---| | صوت Eric default | eleven_v3 + Eric (cjVigY5qzO86Huf0OWal) | v2 للطويل | | صوت WAEL المستنسخ | eleven_v3 + WAEL HD v2 (sTJJWD3ns4Cr4Ag6Rb8G) | v2 | | Arabic native | eleven_v3 (أكثر تعبيراً + 74 لغة) | v2 (29 لغة) | | Storytelling عائلي | eleven_v3 (تعبير عاطفي) | v2 | | Audiobook طويل | v2 (10K) أو flash_v2_5 (40K) | v3 chunked | | Chat live | eleven_flash_v2_5 (low latency) | v3 | | Talking avatar (HeyGen) | HeyGen + v3 voice | Hedra + voice |
لماذا v3 الآن؟ فحص API كشف v3 موجود + يدعم العربية + 74 لغة + most expressive. القيد الوحيد: 5K حرف max (vs 10K لـ v2). الحل: نختار v3 افتراضياً، نرجع لـ v2 للنصوص الأطول.
لا يستخدم tts tool الافتراضي — curl ElevenLabs مباشرة (يرجع صوت نسائي افتراضياً).
استخدام: curl ElevenLabs API مباشر — لا تستخدم tts tool الافتراضي (يرجع صوت نسائي).
Skill: skills/cartesia/ (مُحفظ كمرجع لكن لم نشتري — ElevenLabs أفضل + عندنا).
---
5.1 MiniMax Speech (بديل رخيص للـ batch / 40 لغة) 🆕
حقيقة 💡: MiniMax Speech 2.8 أرخص 3-5× من ElevenLabs + يدعم 40 لغة + 7 emotions + sound tags (laughter, gasp...) + Rapid Voice Clone $1.5 (one-time).
| Model | اللغات | الجودة | السعر | الاستخدام | |---|---|---|---|---| | speech-2.8-hd 🆕 | 40 | Ultra-realistic + sound tags | $100/M chars | مهم عالي الجودة بسعر معقول | | speech-2.8-turbo 🆕 | 40 | Natural + speed | $60/M chars | Batch · chat live · audiobook رخيص | | speech-2.6-hd | 40 | Ultimate similarity | $100/M chars | تسجيل بديل | | speech-02-hd / turbo | 24 | أقدم جداً | نفس الأسعار | لا تستخدم، ترق لـ 2.8 | | Rapid Voice Clone | — | جيد جداً | $1.5/voice (one-time) | بديل رخيص جداً لـ ElevenLabs clone ($5+) | | Voice Design | — | اختراع صوت من الصفر | $3/voice (one-time) | أصوات وهمية للفيديو/الأطفال |
الموقع في الترسانة:
- Eric/WAEL/Arabic premium · Storytelling · Avatars: ابقى على ElevenLabs v3 (جودة عاطفية أعلى + أصوات مسجلة)
- Batch coverage / 40-lang / audiobook رخيص / voice clones سريعة: استخدم MiniMax speech-2.8-turbo ($60/M)
- Sound tags drama (laughter, gasp, sigh): MiniMax speech-2.8-hd — ميزة غير موجودة في ElevenLabs v3 بنفس السهولة
- تجربة سريعة لغة غير مدعومة في ElevenLabs: MiniMax (40 lang vs ElevenLabs 74 لكن تغطية أسيوية أوسع)
POST https://api.minimaxi.chat/v1/t2a_v2
صوت عربي افتراضي مختبر: male-qn-qingse — رجل غتير واضح (Arabic supported via 40-lang model)---
5.2 MiniMax Image 🆕 (بديل رخيص جداً للـ bulk)
| Model | السعر | الاستخدام | |---|---|---| | image-01 | $0.0035/image (أرخص بـ 10-20× من GPT-image-2) | Bulk/concept/non-face work |
للوجوه (عائلة د. وائل): ⚠️ استمر على GPT-image-2 (best) + Gemini 3.1 Pro — MiniMax أضعف في دقة الوجوه (موثّق في TOOLS.md). للرسوم العامة / مفاهيم / إيضاحات: استخدم image-01 — رخيص وفعّال.
---
5.3 MiniMax Video (Hailuo 2.3 + 02 Pro Native 1080p) 🆕
الميزة الفريدة: "Extreme physics mastery" (NCR architecture) + SOTA instruction following + 24fps + Native 1080p.
| Model | 768P/6s | 768P/10s | 1080P/6s | 512P/6s | ملاحظة | |---|---|---|---|---|---| | Hailuo 02 Pro 🆕 (Native 1080p, NCR) | $0.28 | $0.56 | $0.49 | — | الأفضل جودةً بنفس السعر | | Hailuo 2.3 | $0.28 | $0.56 | $0.49 | — | السلسلة الحالية | | Hailuo 2.3 Fast (I2V فقط) | $0.19 | $0.32 | $0.33 | — | الأرخص عالمياً | | Hailuo 02 (legacy) | $0.28 | $0.56 | $0.49 | $0.10 | — |
الموقع في الترسانة:
- Text→Video premium (سينمائي + صوت): Veo 3.1 ($4-24) ابقى عليه
- Image→Video premium: Grok Imagine Video ($4.20) — SOTA حالياً
- 🆕 Premium رخيص (فيزياء + 1080p Native): Hailuo 02 Pro ($0.49) — قفزة جودة عن 2.3 بنفس السعر
- فيزياء دقيقة + رخيص: Hailuo 2.3 ($0.28-0.56) ⭐
- Batch testing/draft دون صوت: Hailuo 2.3 Fast ($0.19)
5.4 MiniMax Special Models
| Model | الوصف | الاستخدام المقترح لد. وائل |
|---|---|---|
| M2-her 🆕 | Multi-character roleplay + immersive long-horizon | قصص تفاعلية للأطفال (جيهان + هبة)، ألغاز عائلية تفاعلية |
| API-vlm | Image/Video/Audio understanding | $0.06/request — بديل رخيص للـ vision (Claude Opus Vision تبقى الأدق للوجوه) |
| MiniMax MCP | رسمياً يعرض TTS/Image/Video/Music عبر MCP | تركيب عبر mcporter لـ Claude Code/Codex |
| MiniMax Agent (web) | agent.minimax.io | ✅ عندنا OpenClaw — لا حاجة |
| MaxClaw / MaxHermes | Cloud agents 24/7 (Telegram/Discord/Slack) | ✅ عندنا OpenClaw — لا حاجة |
---
6️⃣ Voice (STT - Speech to Text)
| المهمة | الأفضل | البديل | |---|---|---| | Arabic + word-level + diarization | xAI STT v1/stt | OpenAI Whisper API | | Multilingual general | OpenAI gpt-4o-transcribe-diarize | xAI STT | | Quick free | Groq Whisper (مجاني) | OpenAI Whisper | | Live Audio Agent | Gemini 3.1 Flash Live (Live API WebSocket) | — | | Music recognition | AudD (Shazam-like) | — |
Config: يحتاج إضافة. سأضيف.
---
7️⃣ Scientific Research (PubMed/Cochrane/arXiv)
| المهمة | الأفضل | البديل | |---|---|---| | بحث طبي (RCT/meta) | PubMed + Claude Opus 4.7 reasoning | OpenFDA + Mistral medium | | Deep multi-source (Background) | Gemini Deep Research Max | Perplexity Pro Deep Research | | Standard Background Research | Gemini Deep Research | Tavily Search + Claude Opus | | Reasoning backbone (deep research synthesis) | Gemini 3.1 Pro Preview ⭐ | Claude Opus 4.8 / GPT-5.5 | | Engineering research | Semantic Scholar + Claude Opus | Web search + Gemini 3.1 Pro 1M |
> ⚠️ gemini-3-pro-preview سُحب من API → HTTP 404 (verified live 2026-06-07). بديله الرسمي = gemini-3.1-pro-preview (HTTP 200). لا تستدعِ 3-pro-preview بعد الآن.
>
> 🧪 Head-to-head verified (2026-06-07): على مهمة deep-research هندسية صعبة (تكميم 3 مخاطر متفاعلة)، Gemini 3.1 Pro أنتج وحده "Interaction Penalty" منفصلاً (تفاعل غير خطي) + تصنيف established/assumptions صريح + تفكير عميق (1943 think tokens). تفوّق منهجي واضح على 3-flash. → ترقية مؤكَّدة كـ reasoning backbone للبحث العميق.
| arXiv papers | Tavily search + Claude Opus | Perplexity |
| General research | Tavily + Perplexity | Firecrawl + Claude |
Tier 1 sources: PubMed/Cochrane/WHO/CDC/NICE (medical) · ESC/ADA/ASCO (specialty) · Tier 1 journals (NEJM, JAMA, Lancet, BMJ)
---
8️⃣ Math & Logic
| المهمة | الأفضل | البديل | |---|---|---| | Symbolic math | Wolfram Alpha API + Claude Opus | SymPy local | | Numerical computation | Python (NumPy/SciPy) | code_execution xAI | | Proofs + reasoning | Claude Opus 4.7 | GPT-5.5 | | Engineering calcs | ACI/Eurocode formulas + Python | Wolfram Alpha | | Stats/regression | statsmodels Python | quantstats |
---
9️⃣ Engineering (Civil/Structural/MEP) — موسّع 2026-06-05
> المرجع الكامل A→Z: ENGINEERING_ARSENAL_MATRIX.md · Router: bash scripts/capability_router.sh engineering <sub>
9.1 Civil Core — أفضل أداة + بديلنا الداخلي
| المهمة | الأقوى عالمياً | بديلنا الداخلي (skill) | Python/Free | |---|---|---|---| | Method Statement (KCPC) ⭐ | Opus 4.8 + خبرة د. وائل |civil-methodology-engine | — |
| Planning / P6 / Schedule | Primavera P6 · ALICE · nPlan | p6-ai-planner (CPM+Monte Carlo) | XER parser |
| Quantity Takeoff / BOQ | Togal.AI · Kreo · CostX | quantity-takeoff-engine | Gemini Vision + ezdxf |
| Claims / EOT / FIDIC | SmartPM · nPlan · Bluebeam | claims-engineering | windows analysis |
| Water/Wastewater Networks | OpenFlows · DHI MIKE | civil-networks | wntr(EPANET)+swmmio(SWMM) |
| Bridges/Tunnels/Marine | CSiBridge · MIDAS · PLAXIS | bridge-tunnel-engine | numpy/scipy beam calc |
| Blueprint OCR | LlamaParse · Mistral OCR 3 | engineering-ocr-blueprints | Mathpix+Gemini+ezdxf+ifcopenshell |
| Routing هندسي | — | civil-design-router | reads MATRIX |9.2 Foundation (متوفر ومُتحقّق)
| المهمة | الأداة | الحالة | |---|---|---| | 3D BIM/Model conversion | Autodesk APS (key ✅) | Model Derivative + Design Automation + Viewer | | Quick 3D concept/massing | Pascal Editor (free) | GLB/STL/OBJ | | Presentation/renders | Adobe (Firefly/PDF/Express, key ✅) | — | | Drawings DWG/DXF | ezdxf ✅ + Autodesk APS | — | | IFC / BIM models | ifcopenshell ✅ | — | | GIS / corridors / drainage | geopandas + rasterio + shapely ✅ | QGIS reference | | Power/Electrical نets | pandapower ✅ | ETAP/DIgSILENT reference | | Solar/PV | pvlib ✅ | — | | Math/structural verify | Wolfram + scipy + ACI/Eurocode | — |9.3 Discipline Solvers — مرجعية/تكامل عند الحاجة (تجارية)
Bentley : OpenRoads · OpenBridge · OpenFlows · PLAXIS
CSI : ETABS · SAFE · SAP2000 · CSiBridge
Trimble : Tekla Structures / Structural Designer
MEP : Revit MEP · Carrier HAP · IESVE · EnergyPlus
السياسة: نبدأ بالبديل الداخلي + Python المجاني؛ نضيف التجاري فقط عند مشروع حقيقي يتطلبه.
Skills (الجديدة 2026-06-05): civil-methodology-engine · p6-ai-planner · quantity-takeoff-engine · claims-engineering · civil-networks · bridge-tunnel-engine · engineering-ocr-blueprints · civil-design-router
Skills (السابقة): engineering-design-stack · pascal-editor · construction · construction-assistant
---
🔟 Medical
| المهمة | الأفضل | البديل | |---|---|---| | Lab interpretation | medical-arsenal skill (lab_interpreter.py) | Claude Opus + Mayo | | Drug lookup | OpenFDA + RxNav + DailyMed (free) | Claude + Drugs.com | | Drug interactions | RxNav (free) | DailyMed | | Patient info | MedlinePlus (free) | Mayo Clinic | | Clinical trials | ClinicalTrials.gov v2 (free) | Europe PMC | | Diagnosis support | ❌ لا أشخّص نهائياً | — |
Safety: Always Tier 1 source + disclaimer + Red flag alerts + ✆ 112 Kuwait emergency
---
1️⃣1️⃣ Economic & Financial
| المهمة | الأفضل | البديل | |---|---|---| | Markowitz portfolio | pypfopt + Claude Opus reasoning | — | | Stock prices | Yahoo Finance (free) | Polygon (مدفوع، تجنّب) | | Crypto prices | CoinGecko (free) | — | | FX rates | Frankfurter API + er-api (free) | — | | Economic data | FRED + World Bank + IMF + TCMB (all free) | — | | Turkish funds | TEFAS API (free) | — | | Forecasting | Prophet + Claude reasoning | ARCH (GARCH) | | Investment advisor weekly | weekly_investment_advisor.py cron | — |
---
1️⃣2️⃣ Legal — الترسانة القانونية (محدث 2026-06-05)
> المرجع الكامل: LEGAL_ARSENAL_MATRIX.md. ليست استشارة ملزِمة.
| المهمة | الأفضل | البديل |
|---|---|---|
| استدلال قانوني عميق / مذكرات | Claude Opus 4.8 (golden chain) | GPT-5.5 · Opus 4.7 |
| بنشمارك قانوني (LegalBench) | Gemini 3.1 Pro / 3.5 Flash (#1 LegalBench) | Opus 4.8 |
| Bilingual legal (AR+EN) | Claude Opus 4.8 + legal-rag skill | GPT-5.5 |
| مراجعة عقود / Contract review | contract-review skill (Opus/Gemini) | Spellbook/Harvey (enterprise) |
| صياغة / Legal drafting | legal-drafting skill + text-humanizer | Spellbook |
| سوابق قضائية (US) | courtlistener-research (CourtListener — مجاني) | Westlaw/Lexis |
| بحث مؤرّض (RAG) | legal-rag (Gemini 3.1 Pro + voyage-law-2) | — |
| مطالبات FIDIC/EOT | claims-engineering + engineering-legal-economic | — |
| Turkish legal docs (Tapu, Vekaletname) | Claude Opus 4.8 + ALKISHAWI transliteration | — |
| Kuwait/GCC commercial law | Opus 4.8 + legal-rag + web_search | Perplexity legal |
| Translation premium | translate skill (Opus tier, domain=legal) | Gemini 3.5 Flash |
---
1️⃣3️⃣ Programming/Coding — تحقيق شامل (محدّث 2026-05-22 مع MiniMax M2.7)
OpenAI Codex variants المتوفرة فعلاً عبر /v1/models:
gpt-5-codex,gpt-5.1-codex(+ max/mini),gpt-5.2-codex,gpt-5.3-codex← الأحدث في فئة Codex- لا يوجد
gpt-5.4-codexأوgpt-5.5-codexحتى الآن (OpenAI لم تصدرهم بعد) - GPT-5.4 + GPT-5.5 (chat) موجودان لكن بدون codex variant
- 230B params total · 10B active (MoE) · 205K context
- SWE-Bench Verified: 78% ≈ Claude Opus 4.6
- SWE-Pro: 56.22% · VIBE-Pro: 55.6% (end-to-end project delivery)
- AIME: 78.3% · GPQA: 82%
- سعر: $0.30/M in, $1.20/M out (standard) — أو $0.60/$2.40 (highspeed ~100 tok/s)
- الميزة الفريدة: ~5 review fixes/session (vs Kimi K2.5 ~50) → الأقل أخطاء و الأكثر حذراً
- ⚠️ بدون image input · ⚠️ Weights non-commercial (API commercial OK)
- ✅ مُسجّل في
models.jsonتحت 4 endpoints (minimax/cn/portal/portal-cn) — Anthropic-compatible
🎯 موقع MiniMax M2.7 في الترسانة:
- Tier 1 (Frontier): gpt-5.3-codex + Claude Opus 4.7 — للمهام الحساسة جداً والتسليمات النهائية
- Tier 2 (Best-Value Open): MiniMax M2.7 ⭐ — جودة Opus 4.6 بـ 1/30 السعر — للـ batch + background + privacy + cost
- Tier 3 (Algorithmic/Long Context): Kimi K2.6 + DeepSeek V4 Pro — للحالات المتخصصة
- Tier 4 (Quick/Cheap): Claude Sonnet 4.6 + Haiku 4.5 + DeepSeek V4 Flash
/v1/models. للـ chat الأحدث = GPT-5.5 (مستخدم في fallback chain).weekly_arsenal_audit سيرصد أي codex أحدث + إصدارات MiniMax الجديدة (M2.8?) فور إصدارها + يحدّث config تلقائياً + يبلّغ Telegram.
Pipeline (mandatory): Superpowers (brainstorming→writing-plans→TDD→verification) + TestSprite final gate
---
1️⃣4️⃣ Translation
| المهمة | الأفضل | البديل | |---|---|---| | Quick (Google quality) | translate.py --quality quick (free) | Gemini 3.5 Flash | | Standard (Gemini Pro) | translate.py --quality standard | Mistral medium | | Premium (engineering/legal/medical) | translate.py --quality premium (Claude Opus) | Sonnet 4.6 | | Bilingual presentation | Claude Opus | Gemini 3.5 Flash |
Replaces: DeepL Pro ($25/m) — رفضناه، عندنا بديل أقوى ومجاني
---
1️⃣5️⃣ Document Analysis
| المهمة | الأفضل | البديل | |---|---|---| | PDF analysis | Claude Opus 4.7 (native PDF) | Gemini 2.5 Pro | | Arabic OCR | Tesseract 5.5 (ara+eng) | Mathpix (math) | | Math equations OCR | Mathpix | — | | DOCX/PPTX/XLSX | python-docx/pptx/openpyxl | LibreOffice headless | | DMS for KCPC | paperclip skill (R2+LanceDB+Voyage embeddings) | — |
Config: pdfModel.primary = Claude Opus 4.7 ✅ (6 fallbacks)
---
1️⃣6️⃣ Vision (Image Understanding)
| المهمة | الأفضل | البديل | |---|---|---| | General vision | Gemini 3.1 Pro Preview | Claude Opus 4.7 | | Face recognition (family) | Claude Opus 4.7 vision | GPT-5.5 | | Quiz/puzzle photos | Gemini 3.1 Pro (fast) | Claude Opus (complex) | | OCR + structured | Mathpix (math) + Claude | Tesseract |
Config: imageModel.primary = Gemini 3.1 Pro Preview ✅
---
1️⃣7️⃣ Web Search & Scraping
| المهمة | الأفضل | البديل | |---|---|---| | Search general | Tavily Search (basic→advanced) | Firecrawl Search | | AI summary search | Perplexity sonar | Tavily with answer | | JS-heavy/bot-protected | Firecrawl Scrape (stealth proxy) | Oxylabs | | Quick fetch | web_fetch tool | — | | Stealth scraping | skills/stealth-browser (Playwright+Oxylabs) | Firecrawl stealth | | Apify scrapers | Apify (instagram, twitter, etc.) | — | | X/Twitter | x_search (xAI) | Apify |
---
1️⃣8️⃣ Embeddings & Memory
| المهمة | الأفضل | البديل | |---|---|---| | Multilingual (AR+EN) | Voyage-3 (1024-dim) | OpenAI text-embedding-3-large | | Code embeddings | Voyage-code-3 | — | | Multimodal | Voyage-multimodal-3 | — | | Memory backend | LanceDB (local) | — | | RAG over docs | Paperclip skill + Voyage | — |
---
1️⃣9️⃣ Office & Productivity
| المهمة | الأفضل | البديل | |---|---|---| | Microsoft 365 (Hotmail+Business) | m365.py skill (Graph API) | — | | Google Workspace | gog CLI (10 services) | — | | Calendar | gog calendar + m365.py | — | | Tasks | m365.py tasks (To Do) | — | | OneDrive | m365.py drive | — | | Email send | m365.py mail send | gog gmail send |
---
2️⃣0️⃣ Specialized Skills (66+ available)
Engineering/Construction: engineering-design-stack · construction · construction-assistant · pascal-editor · paperclip Finance/Investment: investment-analyst · stocks-enhanced · crypto-market · economic-calendar · portfolio-watcher · ai-investment-analyzer · tradingview-webhooks · turkey-real-estate · kuwait-data Medical: medical-arsenal · medical-triage Productivity: microsoft365 · onedrive · notion · linear · taskflow · langfuse Translation/Voice: translate · cartesia (ref) · openai-whisper-api · realtime-voice · vapi · twilio Voice for Wael: Eric (default) · WAEL HD v2 (cloned) · HeyGen Avatar Research: in-depth-research (Deep Research) · briefing · web-search · forecasting-techniques · math-foundation Misc: stealth-browser · web-scraper · video-frames · gifgrep · pdf-summarizer · text-humanizer · self-improvement
---
🔄 Update Workflow (أسبوعي إلزامي)
كل يوم أحد 05:00 الكويت:
1. weekly_arsenal_audit.sh يفحص:
- Anthropic releases (claude.ai/releases)
- OpenAI model list (api.openai.com/v1/models)
- Google AI (ai.google.dev/models)
- xAI (api.x.ai/v1/models)
- DeepSeek, Moonshot, Mistral, Voyage, ElevenLabs releases
- GitHub releases for Claude Code, Codex CLI, Kilo, OpenClaw, MCP servers
2. يقارن مع memory/arsenal-state.json (الحالة المعروفة)
3. لو في:
- Model جديد في فئة → يبحث benchmarks (LMArena, Aider, SWE-bench, MMLU)
- Version جديدة لـ CLI/tool → يحدّث آلياً
- API endpoint جديد → يضيفه للترسانة
4. يحدّث DOMAIN_MODEL_RANKINGS.md إذا في تغيير ranked
5. يرسل تقرير لـ د. وائل: ما الجديد، ما تغيّر، ما هو الـ recommended upgrade
يدوياً عند الحاجة:
bash
bash scripts/weekly_arsenal_audit.sh
---
🔒 Locked Rules
1. لا نتوقف أبداً — fallback chain لكل model (config-enforced)
2. الأفضل دائماً — primary في كل domain يطابق هذه المصفوفة
3. مجاني قبل مدفوع عند تساوي الجودة
4. Benchmark-driven — أي تغيير ranked يلزم بنشمارك موثق
5. Pin to config — أي domain ranking → primary مكتوب في openclaw.json (verify_agreements section 10)
6. Audit weekly — مفروض بـ cron (لا حاجة لتذكير من د. وائل)
---
🎯 v2 UPDATE — 2026-05-24 (Media Golden Chains — M-026 Phase 2)
> مصدر التحقق: live probe /tmp/probe_phase2.txt (2026-05-24 21:17 GMT+2)
> موافقة د. وائل: audio msg #3603 (3 critical fixes + 4 upgrades + Hedra confirmed)
> مفاتيح مفقودة من env.sh: Cartesia, Synthesia, D-ID, Suno, Udio, Sync.so, DeepL → مرفوعة من السلاسل
🖼️ Image — v2
1. OpenAI gpt-image-2-2026-04-21 — وجوه حقيقية، أعلى دقة ✅ verified
2. OpenAI gpt-image-1.5 — transparent background ⭐ جديد ✅ verified
3. Google gemini-3.1-flash-image-preview — production، أسرع ✅ verified
4. Google gemini-3-pro-image-preview — high quality fallback ✅ verified
5. Google imagen-4.0-ultra-generate-001 — creative ✅ verified
6. xAI grok-imagine-image-quality — fast paid ✅ verified
7. OpenAI gpt-image-1-mini — ultra-cheap concepts ✅ verified
8. MiniMax image-01 — bulk non-face (~$0.0035) ✅ verified
9. Replicate Flux models — free fallback
Notes: الوجوه الحقيقية → دائماً #1. حتى 5 صور مرجعية.
🎬 Video Text-to-Video — v2
1. Google veo-3.1-generate-preview ✅ verified — Elo 1095، سينمائي + صوت
2. Google veo-3.1-fast-generate-preview ✅ verified
3. OpenAI sora-2-pro ✅ verified
4. OpenAI sora-2 ✅ verified
5. Google veo-3.1-lite-generate-preview — رخيص
6. Kling 3.0 Omni (PiAPI) · MiniMax Hailuo 2.3 · LTX-2.3 Pro
🎞️ Video Image-to-Video — v2
1. xAI grok-imagine-video ✅ verified — #1 Arena Elo 1093، القاعدة الذهبية لـ I2V
2. Google veo-3.1-fast-generate-preview — fallback عالي الجودة
3. Hedra Character 3 ✅ verified (HTTP 200) — talking image fallback ⭐ مضاف
4. PixVerse V6 · MiniMax Hailuo 2.3 Fast
👤 Talking Avatar (Wael Digital Twin) — v2
1. HeyGen Custom Avatar c6a8b1b1a585404c81361eca7f900b70 + ElevenLabs WAEL_HD_v2 — #1 ثابت
2. Hedra Character 3 ✅ key verified live ⭐ مضاف صراحة (fallback مؤكد)
3. HeyGen Photo Avatar IV — للصور فقط
4. ~~Synthesia~~ — 🔴 UNAVAILABLE (لا مفتاح في env.sh) — FUTURE
💋 Lip-sync Standalone — v2 (جديد)
1. Replicate sync/lipsync-2 ✅ verified (version 3190ef7dc0cb…) ⭐ جديد
2. Hedra Character 3 ✅ verified — lip-sync ممتاز
3. HeyGen Photo Avatar IV
4. ~~Sync.so~~ — 🔴 لا مفتاح
🎵 Music — v2
1. Google lyria-3-pro-preview ✅ verified — #1 سينمائي
2. MiniMax music-2.6 ✅ — Limited FREE ⭐
3. Google lyria-3-clip-preview — clips قصيرة
4. Replicate music models (musicgen) — fallback مجاني
5. MiniMax music-2.0 — batch رخيص ($0.03/5min)
6. ~~Suno / Udio~~ — 🔴 لا مفاتيح
🗣️ TTS Arabic — v2 ⭐ CRITICAL
1. ElevenLabs eleven_v3 + Eric/WAEL_HD_v2/Lama — premium، 74 lang، ≤5K chars
2. Groq canopylabs/orpheus-arabic-saudi ✅ verified ⭐ FREE — لهجة سعودية أصلية
3. ElevenLabs eleven_multilingual_v2 — long form > 5K chars
4. MiniMax speech-2.8-hd — 70% أرخص من ElevenLabs للـ batch
5. ElevenLabs eleven_flash_v2_5 — low-latency chat
6. OpenAI gpt-4o-mini-tts-2025-12-15 ✅ verified — رخيص جداً
7. Google gemini-2.5-flash-preview-tts ✅ verified — free tier
8. ~~Cartesia~~ — 🔴 لا مفتاح
قاعدة إلزامية: قبل أي TTS عربي → CATT Tashkeel (skills/arabic-tashkeel/).
🎙️ STT Arabic — v2
1. OpenAI gpt-4o-mini-transcribe-2025-12-15 ✅ verified ⭐ NEW SKU
2. OpenAI gpt-4o-transcribe-diarize ✅ verified — multi-speaker
3. Groq whisper-large-v3-turbo ✅ verified — ultra-fast FREE
4. AssemblyAI Universal-2 — best diarization paid
5. Deepgram Nova-3 — real-time stream
6. xAI stt
🔬 Research — v2 (محدّث 2026-06-04 — Benchmarks حيّة)
Deep Research Agents (تقارير عميقة متعددة المصادر):
1. Googledeep-research-max-preview-04-2026 ✅ verified ⭐ #1 (DRACO/نصي عميق)
2. Google deep-research-pro-preview-12-2025 ✅ verified
3. Perplexity sonar-deep-research (DRACO benchmark — Perplexity+Harvard)
4. Manus 1.6 ✅ integrated/live (TVIR-Bench: Manus 68.0 = أقوى commercial) — skill: skills/manus-agent/, API verified via x-manus-api-key.
5. Genspark ⚠️ key present but no validated public API endpoint (blocked until official enterprise base URL/docs).
6. Skywork ⚠️ skill built; upstream still HTTP 503 ALB (server-side outage, not auth yet).
7. Hermes Agent (NousResearch, محدّث 2026-06-04) — self-hosted multi-workstreamTVIR-Agent (arXiv 2606.02320, يونيو 2026):
- إطار بحثي أكاديمي (ليس أداة جاهزة) — يُبنى على backbone LLM.
- TVIR-Agent (Qwen3-Max) = #2 overall (74.13 ZH) — الـ backbone (Qwen3.7-Max) موجود عندنا في السلسلة الذهبية (
mulerouter/qwen3.7-max+qwen-codingplan/qwen3.7-max). - البديل العملي: Tongyi DeepResearch (Alibaba-NLP, open-source, MIT) — متاح عبر OpenRouter (
alibaba/tongyi-deepresearch-30b-a3b) بلا GPU. نملك OPENROUTER_API_KEY ✅.
Web Search APIs (Benchmark aimultiple يونيو 2026 — Agent Score):
| # | API | Agent Score | عندنا؟ | |---|---|---|---| | 1 | Brave Search | 14.89 | ✅ BRAVE_API_KEY | | 2 | Firecrawl | 14.58 | ✅ FIRECRAWL_API_KEY | | 3 | Exa | 14.39 | ❌ (Brave أقوى — تُجاهل إلا للبحث الدلالي/find-similar) | | 5 | Tavily | 13.67 | ✅ TAVILY_API_KEY | | 7 | Perplexity | 12.96 | ✅ PERPLEXITY_API_KEY |Exa decision (2026-06-04): نملك Brave (#1) + Firecrawl (#2) أقوى من Exa (#3). Exa ميزته الفريدة = neural "find similar" للأوراق. التوصية: تجاهله (لا يضيف جديداً جوهرياً). Semantic Scholar API = مجاني بلا مفتاح (مستخدم في medical-arsenal) — للأوراق الأكاديمية دون شراء.
💻 Code — v2
1. Claude Opus 4.7 — #1 reasoning + tools
2. OpenAI gpt-5.1-codex-max ✅ verified ⭐ NEW
3. OpenAI gpt-5.3-codex ✅ verified — general code
4. OpenAI gpt-5.2-codex ✅ verified
5. Moonshot kimi-k2.6 — open SOTA
6. DeepSeek v4-pro
7. Mistral mistral-medium-2604 ✅ verified ⭐ NEW
8. Mistral codestral-2508 ✅ verified — code-specialized
9. Z.ai glm-5.1
🧊 3D — v2 (لا تغيير)
Replicate Hunyuan3D · Tripo3D · PiAPI.
📄 OCR — v2 (لا تغيير)
Tesseract (Arabic) · Mathpix (math) · Adobe.
🌐 Translation — v2 (لا تغيير)
translate.py (Gemini → Claude → DeepSeek). ~~DeepL~~ — 🔴 لا مفتاح.
---
🔷 v3 UPDATE — 2026-05-31 (Full Arsenal Scan + Global Ranking — 5 parallel research agents)
> مسح حي كامل + بحث عالمي موثّق. المرجع التفصيلي: GLOBAL_RANKING_COMPARISON_2026-05-31.md + ARSENAL_SCAN_2026-05-31.md.
🎬 Video T2V/I2V — v3 ⭐ تغيير جوهري (Frontier)
اكتشاف: المتصدّران عالمياً (Artificial Analysis Video Arena) أصبحا في متناولنا:
- Seedance 2.0 (ByteDance) — #1 عالمياً: T2V Elo 1213 · I2V Elo 1187. عبر PiAPI (نملك المفتاح ✅). models:
seedance-2($0.10/s),seedance-2-fast($0.08/s). أوضاع: text_to_video / first_last_frames / omni_reference (12 مرجع). - HappyHorse-1.0 (Alibaba) — #2 عالمياً: T2V 1212 (no-audio 1333) · I2V 1171. عبر FAL (مفتاح شغّال ✅). models:
alibaba/happy-horse/{text-to-video,image-to-video,reference-to-video}. joint audio-video + best multilingual lip-sync. - Skill جديد:
skills/frontier-video/(SKILL.md + seedance.py + happyhorse.py — auth مختبر حياً).
🔬 Academic Research — v3 (جديد)
أدوات SaaS (Elicit/Consensus/Scite/OpenEvidence) كلها مدفوعة/مقيّدة (OpenEvidence للأطباء فقط بلا API عام). بنينا البديل المجاني المكافئ (~90%):
- Skill جديد:
skills/academic-research/
lit_search.py (بديل Elicit) — OpenAlex + Europe PMC + Crossref + arXiv + Semantic Scholar (مجاني، مختبر حياً)
- consensus_check.py (بديل Consensus) — جلب أوراق + حكم Gemini/Claude على SUPPORT/CONTRADICT + نسبة إجماع
- medical_evidence.py (بديل OpenEvidence) — PubMed + Europe PMC + تلخيص مدعوم بالاستشهادات + disclaimer
- توصية مفتاح مجاني:
SEMANTIC_SCHOLAR_API_KEY(للموثوقية، يتجنب 429 rate-limit).
🧭 Per-Domain Routing — v3 (توجيه ذكي لموديلات نملكها)
| المجال | وجّه إلى | المصدر | |---|---|---| | قانوني معقّد | Gemini 3.1 Pro | #1 LegalBench (110 موديل) | | مالي معقّد | GPT-5.2 (أعلى GPT متاح) | GPT-5.x #1 Vals finance | | طبي حرج | GPT-5.2 + Claude (second opinion) | GPT-5.x حد أعلى HealthBench | | رياضي/علمي | Claude Opus 4.8 + Wolfram إلزامي | Claude 94.2% GPQA | | بحث آني | gpt-5-search-api + Perplexity sonar | top-4 + أدق factual |
✅ تصحيح ذاتي — v3.1 (2026-05-31)
خطأ سابق صُحّح: ادّعيت أن gpt-5.5 غير موجود — كان خطأ منهجياً (اعتمدت /v1/models list بدل اختبار chat فعلي). الحقيقة (مُختبَرة chat حي):
gpt-5.5✅ يعمل (gpt-5.5-2026-04-23) ·gpt-5.5-pro✅ (عبر /v1/responses) ·gpt-5.4✅ ·gpt-5.2✅ ·gpt-5.3❌ محذوف.- السلسلة الذهبية في openclaw.json سليمة 100%: fallback #1 =
gpt-5.5-pro· #3 =gpt-5.5. لا تصحيح مطلوب. - الدرس: اختبار الاستدعاء الفعلي (chat/responses) > قائمة /v1/models. القائمة قد لا تعرض الأحدث في المقدمة.
🔑 حالة المفاتيح — v3 (مسح حي bash)
- 🟢 شغّال+رصيد: Anthropic · OpenAI · Gemini · Grok · DeepSeek · Groq · Perplexity · Mistral · MuleRouter (
mulerouter/qwen3.7-maxمربوط chat #5 + qwen vl/omni/plus) · MiMo Token Plan · FAL (fal-ai/wan/v2.7فيديو +fal-ai/qwen-imageصور — مربوطان 2026-06-04) · PiAPI - 🔴 يحتاج إجراء: Z.ai/GLM (شحن) · Kimi/Moonshot (مفتاح منتهي — بديل عبر MuleRouter) · Qwen Direct (تفعيل — بديل عبر MuleRouter) · MiMo PAYG (شحن — بديل Token Plan)