🏆 DOMAIN_MODEL_RANKINGS.md — أفضل نموذج لكل مجال

> مرجع إلزامي قبل أي مهمة تخصصية. > يُحدَّث أسبوعياً عبر weekly_arsenal_audit.sh (يوم الأحد 05:00 الكويت). > يُفحص في startup عبر verify_agreements.sh section 10. > > القاعدة الذهبية: الأفضل دائماً → ثم بديل أرخص بنفس الجودة → fallback chain لا تتوقف أبداً.

---

🔌 طبقة الـ Aggregator Backup الموحّدة (مُضافة 2026-06-17 — د. وائل)

الفلسفة (تأكيد د. وائل): هؤلاء المزوّدون = طبقة backup شاملة عبر كل المجالات (chat/فيديو/صوت/صور) بحيث لا انقطاع إطلاقاً. كل واحد يحمل نفس الـ flagship من مصدر بديل + موديلات نادرة غير موجودة عندنا مباشرة. الجودة أولاً، لكن نفس الجودة بسعر أقل = خيار ذكي.

| المزوّد | النوع | المفتاح | دوره في الترسانة | |---|---|---|---| | EvoLink | aggregator ميديا+LLM (153 موديل) | EVOLINK_API_KEY | Backup #1 للميديا النادرة — رصيد مشحون (~658 credit، مدفوع، ليس مجاني). أسعار تنافسية: Seedance 1.5 Pro $0.0247/s · Kling 3.0 $0.075/s · Sora-2 $0.08/s · Veo 3.1 Lite من $0.168/video. يحمل: Sora-2-Pro-Max, Kling o3, Wan 2.6/2.7, Suno v5, nano-banana-pro, Opus 4.8, GPT-5.5. | | OpenRouter | LLM aggregator (400+) | OPENROUTER_API_KEY | Backup #1 للـ LLM — أوسع كتالوج، fallback ذكي لأي flagship نصّي | | Fal | media inference | FAL_API_KEY | backup صور/فيديو سريع (Flux, Kling, Hunyuan) | | Replicate | media inference | REPLICATE_API_TOKEN | backup صور/فيديو (FLUX.2 max, open models) | | HuggingFace | open-weights/embeddings | HF_TOKEN | بحثي/open-source/embeddings مجاني محدود | | Ollama (محلي) | LLM محلي | — | حسّاس KCPC فقط (بعد إذن د. وائل دائماً) | | Portkey | gateway/observability | PORTKEY_API_KEY | standby (Plan-C) — ليس مزوّد موديلات. للـ observability/budget-caps الموحّدة عند الحاجة فقط. OpenClaw fallback chain الداخلي يغطّي الدور حالياً. | | Boomlify | temp-email | BOOMLIFY_API_KEY | أتمتة: OTP/verification/عزل تسجيلات (عند الطلب) |

قاعدة الاستدعاء عبر EvoLink (OpenAI-compatible): base=https://api.evolink.ai/v1, Authorization: Bearer $EVOLINK_API_KEY. للوصول: عند فشل/تعطّل المزوّد المباشر لأي موديل flagship (فيديو/صورة/صوت/نص) → ننتقل للـ aggregator الذي يحمل نفس الموديل (EvoLink/Fal/Replicate/OpenRouter) بلا انقطاع، مع تفضيل الأرخص-بنفس-الجودة.

Ranking داخل كل مجال (دائماً الأفضل→الأقل): المباشر عالي الجودة أولاً (Veo/Grok/GPT-image/HeyGen/السلسلة الذهبية) → ثم aggregator backup (EvoLink/OpenRouter/Fal/Replicate) → ثم رخيص/محلي. التفاصيل في NEW_PLATFORMS_2026-06-17.md.

--- > آخر تحديث يدوي: 2026-05-20 16:00 GMT+2 · آخر audit آلي: راجع memory/arsenal-audit-state.json

---

🌐 إطار الاختيار (في كل مجال)


1. Best in the world (regardless of cost)
2. هل عندنا بديل في النظام بنفس الجودة؟ → استخدمه (وفر الجديد)
3. هل في بديل مجاني خارجي؟ → خذه (وفر المدفوع)
4. أرخص مدفوع يعطي نفس الجودة → آخر خيار
5. عند أي فشل → التالي في القائمة فوراً، لا توقف

---

📊 المصفوفة الشاملة

1️⃣ Text/Chat (General Conversation + Reasoning) — محدّث 2026-07-10 (إضافة عائلة GPT-5.6)

> 🆕 تحديث 2026-07-10 (قرار د. وائل + اختبار حيّ): أُضيفت عائلة GPT-5.6 (Sol/Terra/Luna). openai/gpt-5.6-sol حلّ محل gpt-5.5 في fallback #3 (نفس السعر $5/$30، أداء أعلى، CritPt #1، يتفوّق على 5.5 بـ~5 نقاط وعلى Fable 5 بـ~4). openai/gpt-5.6-terra ($2.5/$15) حلّ محل gpt-5.5-pro المكسور في #7. Codex CLI رُقّي إلى gpt-5.6-sol (reasoning high). التوفّر: OpenAI Direct + OpenRouter (لا EvoLink بعد). القمّة Opus 4.8 لا تُمَسّ.

> 🎖️ معمارية القائد الميداني (2026-06-25): google/gemini-3.1-pro-preview أصبح session primary (القائد الميداني: سرعة + تكلفة أقل بـ 90% + إدارة الترسانة). Claude Opus 4.8 يبقى #1 جودة للتحليل العميق ويُستدعى كـ fallback #1 / sub-agent للمهام المعقّدة فقط. هذا يحقق المعادلة الذهبية: أعلى دقة (Opus عند الحاجة) × أفضل تكلفة (Gemini للتشغيل اليومي).

| الترتيب | النموذج | السياق | السعر/M | نقاط القوة | |---|---|---|---|---| | ★ Field Commander | Gemini 3.1 Pro Preview (session primary) google/gemini-3.1-pro-preview | 1M | $1.25/M | قائد ميداني: سرعة + سياق 1M + توجيه الترسانة + تكلفة منخفضة (2026-06-25) | | 0 (قمة الجودة 2026-07-25) | Claude Opus 5 (Anthropic Direct) ← session primary الجديد claude-opus-5 | 1M | $5/$25 | أقوى استدلال/برمجة (ARC-AGI-3: 30.2) — نفس سعر 4.8. ⚠️ للمهام غير الأكاديمية فقط (يرفض الأكاديمي) | | 1 (جودة) | Claude Opus 4.8 (Anthropic Direct) ← fb #1 + أداة الربط الأكاديمي claude-opus-4-8 | 1M | $5/$25 | أعلى جودة تحليل عميق + يستوعب التغليف الأكاديمي (Anthropic 2026-05-28) | | 2 | Claude Opus 4.7 (Anthropic Direct) claude-opus-4-7 | 1M | $15/M | سابق PRIMARY — أعلى جودة + استقرار | | 3 | ChatGPT 5.6 Sol (openai/gpt-5.6-sol) 🆕 | 1M | $5/$30 | OpenAI الأحدث — CritPt #1، يفوق 5.5 وFable 5. عائلة: Terra $2.5/$15، Luna $1/$6 | | 4 | Gemini 3.1 Pro Preview | 1M | $1.25/M | سياق كبير + multimodal | | 5 | Qwen 3.7 Max (via MuleRouter) mulerouter/qwen3.7-max | 262K | MuleRouter | #4-5 عالمياً (AA Intelligence Index 57) — أضيف 2026-06-04 | | 6 | Grok 4.5 | 256K | $3/M | xAI، تحديث الأخبار | | 7 | Gemini 3.5 Flash | 1M | مجاني (KW) | الأحدث، سريع جداً | | 7b | google/gemini-3.5-flash-lite (Gemini 3.5 Flash-Lite) | 1M | رخيص جداً (KW) | ⚡ الأسرع 6× (0.7s حيّ 2026-07-22) — طبقة السرعة القصوى: fallback سريع + OCR + مهام خلفية | | 7c | google/gemini-3.6-flash (Gemini 3.6 Flash) | 1M | رخيص (KW) | أذكى في المعقّد (لا أسرع: 4.7s حيّ) — طبقة أذكى فوق flash-lite. مُضاف 2026-07-22 بقرار د. وائل | | 8 | Claude Opus 4.6 | 1M | $15/M | بديل Opus | | 9 | Claude Sonnet 5 (claude-sonnet-5) | 1M | $2/$10 عرض→$3/$15 | ترقية 4.6 بنفس السعر، tokenizer +30% | | 10 | Kimi K2.6 (مباشر moonshot/) | 256K | $0.60/$2.50 | Moonshot — #1 مفتوح عالمياً (AA Index 54، #4 عام). enterprise-tier-2 (~125M توكن). للـ agentic/الوسائط البصرية | | 11 | MiniMax M3 (openrouter/minimax/minimax-m3) 🆕 | 1M | $0.30/$1.20 (خصم) | frontier برمجة (SWE-Bench Pro 59%) + agentic، سياق مليوني رخيص جداً. مباشر يبقى للوسائط (مسار غير قياسي) | | 12 | Kimi K2.7-Code (مباشر moonshot/) 🆕 | 256K | $0.75/$3.50 | برمجة سريعة (HighSpeed 6×، توفير 30% توكنات). متخصّص كود — ليس بديلاً عن K2.6 في الـ agentic/الوسائط | | 13 | DeepSeek V4 Pro | 128K | $0.14/M | الأرخص الذكي |

> تحديث 2026-06-25 (دراسة Kimi/MiniMax + اختبار حيّ): Kimi المباشر سليم (المفتاح حيّ، enterprise-tier-2؛ الموديلات تقبل temperature=1 فقط). أُضيف M3 (OpenRouter) و K2.7-Code (مباشر) للسلسلة في الطبقة المفتوحة. الوسائط (Speech 2.8 / Hailuo 2.3 / Music / image-01) مدمجة ومحدّثة — بلا تغيير. القمّة Opus 4.8 لا تُمَسّ.

> تحديث 2026-07-19 (إضافة 3 fallbacks جديدة للطبقة المفتوحة — اختبار حيّ بعد restart): أُضيفت للسلسلة الحيّة: > - Kimi K3 (moonshot/kimi-k3) عند fb[10] — أحدث جيل Moonshot، يعلو K2.6/K2.7 (كلاهما مُبقىً: K2.6 عند fb[11]، K2.7-Code عند fb[14]). > - KAT-Coder-Air (openrouter/kwaipilot/kat-coder-air-v2.5) عند fb[13] — نموذج برمجة خفيف/سريع من Kwaipilot عبر OpenRouter. > - Inkling (openrouter/thinkingmachines/inkling) عند fb[20] — ThinkingMachines عبر OpenRouter، طبقة تنويع. > المجموع 29 fallback. القمّة Opus 4.8 + أعلى 9 لا تُمَسّ.

Auto-Route by Context: دائماً Opus Direct (1M) → compaction عند 850K → fallback chain. Nexos أُزيل من الترتيب التلقائي (M-027 + 2026-05-28). يدوي فقط عبر NEXOS_API_KEY عند طلب صريح بالنص.

---

2️⃣ Image Generation — Artificial Analysis Arena (Live, 2026-05-21)

2.1 Text → Image (Top 12 Global)

| # | الموديل | Provider | Elo | $/1K | عندنا؟ | |---|---|---|---|---|---| | 1 | GPT Image 2 (high) | OpenAI | 1338 | $211 | ✅ openai/gpt-image-2 | | 2 | GPT Image 1.5 (high) | OpenAI | 1265 | $133 | ✅ | | 3 | Nano Banana 2 | Google (3.1 Flash Image) | 1263 | $67 ⭐ | ✅ gemini-3.1-flash-image-preview | | 4 | Nano Banana Pro | Google (3 Pro Image) | 1221 | $134 | ✅ | | 5 | MAI-Image-2 | Microsoft | 1196 | $50 | ❌ (Bing only) | | 6 | FLUX.2 [max] | Black Forest | 1196 | $70 | ✅ via Replicate | | 7 | Seedream 4.0 | ByteDance | 1194 | $30 | ✅ via fal | | 8 | FLUX.2 [pro] | Black Forest | 1186 | $30 | ✅ | | 9 | HiDream-O1-Image-Dev-2604 | HiDream | 1183 | Open | — | | 10 | grok-imagine-image | xAI | 1180 | $20 ⭐⭐ | ✅ xai/grok-imagine-image | | 11 | ImagineArt 2.0 | ImagineArt | 1177 | $30 | — | | 12 | Imagen 4 Ultra | Google | 1170 | $60 | ✅ (US region) |

2.2 Image → Image (محاكاة الصور الحقيقية + التحرير) Top 10

| # | الموديل | Provider | Elo | $/1K | عندنا؟ | |---|---|---|---|---|---| | 1 | GPT Image 1.5 (high) | OpenAI | 1265 | $133 | ✅ | | 2 | GPT Image 2 (high) | OpenAI | 1253 | $211 | ✅ | | 3 | Nano Banana Pro | Google | 1240 | $134 | ✅ | | 4 | Nano Banana 2 | Google | 1235 | $67 ⭐ | ✅ | | 5 | HunyuanImage 3.0 Instruct | Tencent | 1223 | $90 | ✅ via Fal | | 6 | grok-imagine-image | xAI | 1214 | $20 ⭐⭐ الأرخص | ✅ | | 7 | HiDream-O1-Image | HiDream | 1213 | $40 | Open | | 8 | Kling Image 3.0 Omni | KlingAI | 1208 | coming | — | | 9 | FLUX.2 [max] | Black Forest | 1205 | $140 | ✅ | | 10 | Wan 2.7 Pro | Alibaba | 1202 | coming | — |

2.3 Use-case Mapping (الخلاصة)

| المهمة | الأفضل | البديل ذكي ($) | البديل المجاني | |---|---|---|---| | Face accuracy (family, real people) | GPT-image-2 ($0.21/img) | Nano Banana 2 ($0.067/img) | — | | Photorealistic from text | GPT-image-2 | Nano Banana 2 | grok-imagine-image ($0.02) | | Edit real photo (background, retouch, swap) | GPT Image 1.5 | Nano Banana 2 | grok-imagine-image | | Ultrawide / Large Print | Imagen 4 Ultra | GPT-image-2 | FLUX.2 [max] | | Speed/quick draft | Nano Banana 2 | Imagen 4 Fast | grok-imagine-image | | Artistic/stylized | Grok Imagine Quality | FLUX.2 [max] | Seedream 4.5 | | Logo/icon | GPT-image-2 | Recraft V4 Pro | Nano Banana 2 | | Text rendering in image | GPT-image-2 | Nano Banana Pro | Ideogram 3.0 | | Open-weight self-host | HiDream-O1-Image-Dev | FLUX.2 [dev] | Z-Image Turbo |

Config: imageGenerationModel.primary = openai/gpt-image-2 ✅ Fallbacks (مُعاد ترتيبها 2026-06-04 حسب Arena يونيو 2026 — الأقوى→الأضعف + تنويع مزوّدين):


1. google/gemini-3.1-flash-image-preview   (Nano Banana 2 — #2 عالمياً T2I 1271 / Edit 1387)
2. google/gemini-3-pro-image-preview        (Nano Banana Pro — #3-6)
3. openai/gpt-image-1.5                       (#4-5 T2I 1241 / Edit 1374 — نفس مزوّد redundancy)
4. xai/grok-imagine-image-quality            (#5 Edit 1388 — مزوّد مختلف = أمان)
5. black-forest-labs/flux-2-pro              (قوي/رخيص)
6. minimax/image-01                           (bulk رخيص — ليس للوجوه)
7. fal/fal-ai/flux/dev                         (مجاني احتياطي)

سابقاً (مُلغى): كان #2 = fal/fal-ai/qwen-image (Elo ~1115 ضعيف) — أُزيل لأنه أضعف بـ156 نقطة Elo من Nano Banana 2. mediaGenerationAutoProviderFallback=true يُلحق مزوّدين إضافيين auto = طبقة never-stop. للوجوه الحقيقية: GPT Image 2 (Edit Elo 1467 #1 عالمياً) حصراً ثم Nano Banana Pro/2.

القاعدة الذهبية للصور: للوجوه الحقيقية لعائلة د. وائل = GPT Image 2 (لا تنازل). للمهام الأخرى، Nano Banana 2 يقدم 91% من جودة GPT بـ 32% من السعر — best value.

---

3️⃣ Video Generation — مفصّل بـ 4 أبعاد (محدّث 2026-05-20 19:15 — Artificial Analysis Arena)

> مرجع البنشمارك: Artificial Analysis Text-to-Video + Image-to-Video Leaderboards (مايو 2026) > القاعدة: الأفضل عالمياً → بديل عندنا بنفس الجودة → مجاني → أرخص مدفوع

3.1 Text → Video (سينمائي + صوت)

| الترتيب | الموديل | Elo | السعر/min | تعليق | |---|---|---|---|---| | PRIMARY | Veo 3.1 (Google) | 1095 | $24.00 | 4K + audio native — الأفضل في فئته | | #2 | Veo 3.1 Fast | 1091 | $9.00 | نفس الجودة، أرخص 62% | | #3 | Kling 3.0 Omni 1080p Pro | 1098 | $16.80 | متاح عبر fal.ai أو PiAPI 🆕 | | #4 | Sora 2 Pro | 1075 | $30.00 | للسرديّات المعقدة | | #5 | Sora 2 (December) | 1083 | $6.00 | جودة Pro بسعر معقول | | #6 | Runway Gen-4.5 | — | API maturity | للـ director-style control 🔄 (محدّث من Gen-4) | | #7 | Vidu Q3 Pro | 1078 | $9.60 | 🆕 | | #8 | Hailuo 2.3 | — | رخيص | 🔄 (محدّث من Hailuo 02) | | #9 | Seedance 1.5 Pro | 1000 | $11.86 | متاح | | #10 | PixVerse V6 | 1067 | $6.90 | budget option 🆕 | | #11 | Veo 3.1 Lite | 1074 | $4.80 | أرخص Veo | | #12 | LTX-2.3 Pro (open weights) | 958 | $2.40-3.60 | الأرخص في top-20 🆕 — #1 open-weights مع audio (AA Arena) |

Watch (لا API بعد): Seedance 2.0 (Elo 1212 #1) · HappyHorse-1.0 (1209 #2) — مراقبة أسبوعية

> ✅ Gemini Omni Flash (gemini-omni-flash-preview) — تصحيح مُوثّق 2026-07-12 (اختبار حيّ ناجح ×2، يُلغي ملاحظة 2026-07-05): هو فعلاً مولّد + محرّر فيديو، لكن الوصول عبر Interactions API فقط (POST https://generativelanguage.googleapis.com/v1beta/interactions)، لا generateContent. اختبار حيّ بمفتاحنا: HTTP 200 · status=completed · فيديو 2s (~17.7K video tokens) · URI قابل للتنزيل. ملاحظة 2026-07-05 توقّفت عند خطأ «only supports Interactions API» واستنتجت خطأً «ليس مولّد فيديو» دون استدعاء الـ Interactions API فعلياً — والاختبار اليوم يدحضها. > الموضع: (1) محرّر فيديو stateful #1 (تحرير متعدّد الأدوار عبر previous_interaction_id — يسدّ فجوة كنّا نغطّيها بـ Runway Aleph)، (2) T2V سريع/رخيص fallback تحت Veo 3.1 (لا يُرفع فوق Veo للسينمائي حتى بنشمارك جودة). الأداة الجاهزة (مُختبرة حيّة): skills/omni-flash-video/omni_flash.py. > القمة الآن: T2V=Veo 3.1 · I2V=Grok Imagine · تحرير/سريع=Omni Flash (جديد، مُثبت). (درس: لا تستنتج غياب قدرة من رسالة خطأ endpoint — جرّب الـ endpoint الصحيح أولاً.)

> 💰 Budget video pipeline (توفير مقابل Veo — مُعتمد 2026-06-07): لمشاهد لا تحتاج جودة Veo السينمائية، الفكرة الأعمق (أقرّها د. وائل): ولّد الفيديو صامتاً بطبقة budget ثم ركّب صوت OpenAI gpt-audio (TTS/realtime) عبر media-editing-arsenal/media_edit.py — أرخص بكثير من Veo native audio. > > 🏆 دراسة LTX-2.3 — rank عالمي + تكلفة (verified live 2026-06-07, Artificial Analysis Arena): > - Text-to-Video (with audio): LTX-2.3 Fast = Elo 974 — #1 بين open-weights فقط، لكن ~360-410 نقطة تحت Veo 3.1 (~1213-1386). عالمياً ≈ #11-12. > - Image-to-Video (with audio): LTX-2.3 Pro = Elo 955 — #1 open-weights. > - التكلفة: Fast 720p ~$0.03/sec · Fast 1080p ~$0.05 · Pro 720p ~$0.06 · Pro 1080p ~$0.10/sec. open-weights مجاني محلياً (يحتاج GPU). > > ✅ التوصية النهائية (بعد الفحص): لا ندمج LTX-2.3 كطبقة budget الآن. السبب: ترسانتنا تملك بدائل budget أقوى Elo + موصولة فوراً بأداة video_generate: Grok Imagine ($4.20/min، Elo 1093) للـ I2V · Hailuo 2.3 Fast / Seedance 2.0 fast للتجربة الرخيصة. LTX أرخص نظرياً لكن أضعف جودة + غير موصول + سيرفرنا CPU لا يشغّله محلياً. > > 👁️ Watch-list فقط: LTX-2.3 يستحق الإضافة فقط لسيناريو "تشغيل محلي مجاني 100% لبيانات حساسة" على GPD Win Max 2 (Radeon 890M) — مثل قاعدة Ollama للنصوص. > > القاعدة المُعتمدة: القمة = Veo 3.1 · budget = Grok Imagine + Hailuo/Seedance · LTX = watch-list (محلي/GPD فقط). فكرة silent-video + OpenAI gpt-audio تبقى صالحة لأي طبقة budget لتوفير Veo native audio.

3.2 Image → Video (🚨 ترتيب مختلف!)

| الترتيب | الموديل | Elo | السعر/min | تعليق | |---|---|---|---|---| | PRIMARY | 🔥 Grok Imagine Video (xAI) | 1093 | $4.20 | #3 عالمياً، متفوق على Veo 3.1 نفسه! الأرخص في القمة ⭐ | | #2 | Veo 3.1 Fast | 1091 | $9.00 | بديل قوي | | #3 | Veo 3.1 | 1085 | $24.00 | جودة أعلى لكن أغلى | | #4 | PixVerse V6 | 1081 | $6.90 | 🆕 | | #5 | Kling 3.0 1080p Pro | 1080 | $20.16 | 🆕 | | #6 | Kling 3.0 Omni 1080p | 1067 | $16.80 | 🆕 | | #7 | Veo 3.1 Lite | 1063 | $4.80 | أرخص | | #8 | Vidu Q3 Pro | 1059 | $9.60 | 🆕 | | #9 | Seedance 1.5 Pro | 1000 | $11.86 | متاح |

3.3 Talking Avatar (محاكي الأشخاص الحقيقيين)

| الحالة | الأفضل | البديل | |---|---|---| | Wael Digital Twin | HeyGen Custom Avatar c6a8b1b1 + ElevenLabs WAEL HD v2 (sTJJWD3ns4Cr4Ag6Rb8G) | Hedra Character 3 + ElevenLabs | | Talking head شخص آخر | HeyGen Custom Avatar (من 2-min فيديو) + ElevenLabs voice clone | Hedra Character 3 | | صورة فقط → talking | HeyGen Photo Avatar IV | Hedra Character 3 | | Corporate enterprise | HeyGen (300+ langs) | Synthesia (140 langs, Avatar IV — alternative، لا نشتري إلا للضرورة) | | تجربة سريعة مجانية | Hedra Free Trial | — |

القاعدة لـ Avatars: HeyGen يغطي 99% من use cases → لا نشتري Synthesia إلا لو احتجنا feature خاص (enterprise LMS مثلاً). Hedra مجاني trial = backup ممتاز.

3.4 خاصة (Cinematic Camera / Editing / Lip-Sync Arabic)

| المهمة | الأفضل | البديل | |---|---|---| | حركة كاميرا سينمائية | Higgsfield DoP-2 | Runway Gen-4.5 | | تحرير فيديو موجود | Runway Aleph | Higgsfield | | Arabic Lip-Sync | HeyGen + ElevenLabs v3 (stack) | Synthesia (corporate fallback) | | Vision verify قبل الإرسال | Claude Opus 4.7 Vision أو Gemini 3.1 Pro | إلزامي 100% (M-XER protocol) |

Config: videoGenerationModel.primary = google/veo-3.1-generate-preview (للـ text→video) Fallbacks: veo-fast → sora-2-pro → sora-2 → kling-3-omni 🆕 → grok-imagine-video 🆕 → runway-gen4.5 → hailuo-2.3 → seedance → vidu-q3-pro 🆕 → pixverse-v6 🆕 → ltx-2.3-pro 🆕 → wan-2.7 Note: Text→Video يستخدم حساب الـ US لأنه أسرع بـ 22% لـ Veo. Image→Video يستخدم Grok Imagine PRIMARY (مش Veo) — استدعِ xai/grok-imagine-video مباشرة عند image input

---

4️⃣ Music Generation (محدّث 2026-05-24 — ElevenMusic API دخل السوق)

| المهمة | 🥇 الأفضل | 🥈 البديل #1 | 🥉 البديل #2 (رخيص/مجاني) | |---|---|---|---| | سينمائي + موسيقى احترافية | Google Lyria 3 Pro Preview | ElevenMusic API 🆕 (Apr 2026) | MiniMax Music 2.6 (Limited FREE ⭐) | | أغنية بكلمات/غناء (vocal) | 🎤 Suno V5.5 (SOTA vocal — أحدث) | ElevenMusic 🆕 | MiniMax Music 2.6 (Limited FREE ⭐ — fallback/backup) | | Lyrics + غناء (بديل) | Suno V5.5 | Lyria 3 Pro / ElevenMusic | MiniMax Music 2.6 | | Cover versions (من صوت مرجعي) | MiniMax Music-Cover 🆕 | ElevenMusic remix | — | | Instrumental فقط | Lyria 3 Pro Instrumental | ElevenMusic instrumental | MiniMax Music 2.5+ | | Short Clips (~30s) | Lyria 3 Clip Preview | ElevenMusic | MiniMax Music 2.6 | | Lyrics text generation | MiniMax Lyrics ($0.01/song FREE ⭐) | Claude Opus 4.7 | — | | Batch/cheap | MiniMax Music 2.0 ($0.03/5min) | Music 2.5+ | — |

Config: musicGenerationModel.primary = google/lyria-3-pro-preview ✅ 🆕 ElevenMusic (Apr 29, 2026): أول دخول لـ ElevenLabs لتوليد الموسيقى — متاح عبر /v1/music على ELEVENLABS_API_KEY الحالي. مرشّح ليصبح SOTA للأصوات الغنائية. 🆕 Music-2.6 (Apr 10, 2026): Limited FREE · Cover Reborn + Bass Redefined · بديل صفري التكلفة. 🎤 Suno V5.5 (SOTA vocal — مؤكّد حيّاً 2026-07-12، suno.com/blog/v5-5): القمة لأي أغنية بكلمات/غناء — أكثر تعبيراً + custom models (تدريب على كتالوجك) (skills/suno-music/، SUNO_API_KEY، يحتاج UA header + curl لتحميل CDN). Lyria 3 Pro + MiniMax Music 2.6 = بديلان (Lyria للسينمائي/الآلي، MiniMax رخيص/مجاني محدود). سلسلة الغناء: Suno V5.5 ثم ElevenMusic ثم Lyria 3 Pro ثم MiniMax 2.6.

---

5️⃣ Voice (TTS) — محدّث 2026-06-16 (✅ أُضيف Gemini 3.1 Flash TTS = #2 عالمياً — سد فجوة الصوت)

> مصدر الترتيب: Artificial Analysis Speech Arena — live 2026-06-16. > ✅ فُعّل gemini-3.1-flash-tts-preview = #2 عالمياً (Elo 1218) — verified حياً (عربي 24kHz)، أرخص 5× ($18.3/1M vs $100). الترسانة الآن تمسك #2 عالمياً للـ TTS العام.

الترتيب العالمي (Speech Arena live 2026-06-16): #1 Fun-Realtime-TTS (Alibaba, 1224, غير مربوط) · #2 Gemini 3.1 Flash TTS (1218) ✅ عندنا · #4 Cartesia Sonic 3.5 (1205) · #5 xAI TTS (1200) ✅ · #9 ElevenLabs v3 (1179) ✅ · #10 MiniMax 2.8 HD (1174) ✅.

السياسة: للصوت المستنسخ (WAEL/Eric) الأدوات المرجعية تبقى ElevenLabs v3 (الاستنساخ أنضج). للـ TTS العام عالي الجودة + أرخص = Gemini 3.1 Flash TTS (#2).

موديلات ElevenLabs + MiniMax + Gemini — Auto-Route حسب طول النص + نوع الاستخدام:

| Model | اللغات | Max Chars | التعبير | Finetune | الاستخدام | |---|---|---|---|---|---| | gemini-3.1-flash-tts-preview 🆕 #2 عالمياً | 24+ (عربي ✅) | طويل | ✨ عالٍ + توجيه بالوصف | ❌ | TTS عام عالي الجودة + أرخص 5× ($18/1M) | | eleven_v3 ← للاستنساخ/الأصوات المسجلة | 74 (عربي ✅) | 5,000 | ✨ most expressive | ❌ | صوت WAEL/Eric المستنسخ + جودة عاطفية | | eleven_text_to_dialogue 🆕 | 70+ | — | 🎭 multi-speaker | ❌ | حوارات، بودكاست، قصص متعددة الأصوات | | eleven_multilingual_v2 | 29 (عربي ✅) | 10,000 | غني جداً | ✅ | نصوص متوسطة/طويلة + audiobook | | eleven_flash_v2_5 | 32 (عربي ✅) | 40,000 | جيد | ✅ | سرعة عالية + نصوص طويلة | | MiniMax speech-2.8-hd | 40 | — | عالي + 7 emotions | ✅ Clone | بديل رخيص 70% للطويل | | MiniMax speech-2.6 🆕 (Mar 2026) | 40 | — | جيد | — | ultra-low latency للـ chat realtime | | MiniMax speech-2.8-turbo | 40 | — | جيد | — | أرخص دفعات (audiobook) |

Auto-Route Logic (مكتوبة في skill):


text length ≤ 5,000   → eleven_v3 (جودة أعلى + 74 لغة)
5,000 < text ≤ 10,000 → eleven_multilingual_v2 (تعبير غني)
text > 10,000         → eleven_flash_v2_5 أو chunking لـ v3
latency-critical chat → eleven_flash_v2_5

| المهمة | الأفضل | البديل | |---|---|---| | صوت Eric default | eleven_v3 + Eric (cjVigY5qzO86Huf0OWal) | v2 للطويل | | صوت WAEL المستنسخ | eleven_v3 + WAEL HD v2 (sTJJWD3ns4Cr4Ag6Rb8G) | v2 | | Arabic native | eleven_v3 (أكثر تعبيراً + 74 لغة) | v2 (29 لغة) | | Storytelling عائلي | eleven_v3 (تعبير عاطفي) | v2 | | Audiobook طويل | v2 (10K) أو flash_v2_5 (40K) | v3 chunked | | Chat live | eleven_flash_v2_5 (low latency) | v3 | | Talking avatar (HeyGen) | HeyGen + v3 voice | Hedra + voice |

لماذا v3 الآن؟ فحص API كشف v3 موجود + يدعم العربية + 74 لغة + most expressive. القيد الوحيد: 5K حرف max (vs 10K لـ v2). الحل: نختار v3 افتراضياً، نرجع لـ v2 للنصوص الأطول. لا يستخدم tts tool الافتراضي — curl ElevenLabs مباشرة (يرجع صوت نسائي افتراضياً).

استخدام: curl ElevenLabs API مباشر — لا تستخدم tts tool الافتراضي (يرجع صوت نسائي). Skill: skills/cartesia/ (مُحفظ كمرجع لكن لم نشتري — ElevenLabs أفضل + عندنا).

---

5.1 MiniMax Speech (بديل رخيص للـ batch / 40 لغة) 🆕

حقيقة 💡: MiniMax Speech 2.8 أرخص 3-5× من ElevenLabs + يدعم 40 لغة + 7 emotions + sound tags (laughter, gasp...) + Rapid Voice Clone $1.5 (one-time).

| Model | اللغات | الجودة | السعر | الاستخدام | |---|---|---|---|---| | speech-2.8-hd 🆕 | 40 | Ultra-realistic + sound tags | $100/M chars | مهم عالي الجودة بسعر معقول | | speech-2.8-turbo 🆕 | 40 | Natural + speed | $60/M chars | Batch · chat live · audiobook رخيص | | speech-2.6-hd | 40 | Ultimate similarity | $100/M chars | تسجيل بديل | | speech-02-hd / turbo | 24 | أقدم جداً | نفس الأسعار | لا تستخدم، ترق لـ 2.8 | | Rapid Voice Clone | — | جيد جداً | $1.5/voice (one-time) | بديل رخيص جداً لـ ElevenLabs clone ($5+) | | Voice Design | — | اختراع صوت من الصفر | $3/voice (one-time) | أصوات وهمية للفيديو/الأطفال |

الموقع في الترسانة:

Eric/WAEL/Arabic premium · Storytelling · Avatars: ابقى على ElevenLabs v3 (جودة عاطفية أعلى + أصوات مسجلة)
Batch coverage / 40-lang / audiobook رخيص / voice clones سريعة: استخدم MiniMax speech-2.8-turbo ($60/M)
Sound tags drama (laughter, gasp, sigh): MiniMax speech-2.8-hd — ميزة غير موجودة في ElevenLabs v3 بنفس السهولة
تجربة سريعة لغة غير مدعومة في ElevenLabs: MiniMax (40 lang vs ElevenLabs 74 لكن تغطية أسيوية أوسع)

Endpoint: POST https://api.minimaxi.chat/v1/t2a_v2 صوت عربي افتراضي مختبر: male-qn-qingse — رجل غتير واضح (Arabic supported via 40-lang model)

---

5.2 MiniMax Image 🆕 (بديل رخيص جداً للـ bulk)

| Model | السعر | الاستخدام | |---|---|---| | image-01 | $0.0035/image (أرخص بـ 10-20× من GPT-image-2) | Bulk/concept/non-face work |

للوجوه (عائلة د. وائل): ⚠️ استمر على GPT-image-2 (best) + Gemini 3.1 Pro — MiniMax أضعف في دقة الوجوه (موثّق في TOOLS.md). للرسوم العامة / مفاهيم / إيضاحات: استخدم image-01 — رخيص وفعّال.

---

5.3 MiniMax Video (Hailuo 2.3 + 02 Pro Native 1080p) 🆕

الميزة الفريدة: "Extreme physics mastery" (NCR architecture) + SOTA instruction following + 24fps + Native 1080p.

| Model | 768P/6s | 768P/10s | 1080P/6s | 512P/6s | ملاحظة | |---|---|---|---|---|---| | Hailuo 02 Pro 🆕 (Native 1080p, NCR) | $0.28 | $0.56 | $0.49 | — | الأفضل جودةً بنفس السعر | | Hailuo 2.3 | $0.28 | $0.56 | $0.49 | — | السلسلة الحالية | | Hailuo 2.3 Fast (I2V فقط) | $0.19 | $0.32 | $0.33 | — | الأرخص عالمياً | | Hailuo 02 (legacy) | $0.28 | $0.56 | $0.49 | $0.10 | — |

الموقع في الترسانة:

Text→Video premium (سينمائي + صوت): Veo 3.1 ($4-24) ابقى عليه
Image→Video premium: Grok Imagine Video ($4.20) — SOTA حالياً
🆕 Premium رخيص (فيزياء + 1080p Native): Hailuo 02 Pro ($0.49) — قفزة جودة عن 2.3 بنفس السعر
فيزياء دقيقة + رخيص: Hailuo 2.3 ($0.28-0.56) ⭐
Batch testing/draft دون صوت: Hailuo 2.3 Fast ($0.19)

---

5.4 MiniMax Special Models

| Model | الوصف | الاستخدام المقترح لد. وائل | |---|---|---| | M2-her 🆕 | Multi-character roleplay + immersive long-horizon | قصص تفاعلية للأطفال (جيهان + هبة)، ألغاز عائلية تفاعلية | | API-vlm | Image/Video/Audio understanding | $0.06/request — بديل رخيص للـ vision (Claude Opus Vision تبقى الأدق للوجوه) | | MiniMax MCP | رسمياً يعرض TTS/Image/Video/Music عبر MCP | تركيب عبر mcporter لـ Claude Code/Codex | | MiniMax Agent (web) | agent.minimax.io | ✅ عندنا OpenClaw — لا حاجة | | MaxClaw / MaxHermes | Cloud agents 24/7 (Telegram/Discord/Slack) | ✅ عندنا OpenClaw — لا حاجة |

---

6️⃣ Voice (STT - Speech to Text)

| المهمة | الأفضل | البديل | |---|---|---| | Arabic + word-level + diarization | xAI STT v1/stt | OpenAI Whisper API | | Multilingual general | OpenAI gpt-4o-transcribe-diarize | xAI STT | | Quick free | Groq Whisper (مجاني) | OpenAI Whisper | | Live Audio Agent | Gemini 3.1 Flash Live (Live API WebSocket) | — | | Music recognition | AudD (Shazam-like) | — |

> 🆕 SOTA STT — مُحدّث + مُختبر حياً 2026-07-05 (Artificial Analysis AA-WER + اختبار عربي حي): > - الترتيب العالمي (AA-WER): #1 Fun-Realtime-ASR-preview (1.7%) · #2 ElevenLabs Scribe v2 (2.2%) · #3 MAI-Transcribe-1.5 (2.4%). Fun-Realtime = الأدقّ نظرياً لكن بلا API مؤكّد لنا (watch). > - الأفضل العملي المتاح لنا = ElevenLabs Scribe v2 (scribe_v2 عبر /v1/speech-to-text، مفتاحنا creator، اختُبر حياً 2026-07-05: عربي مثالي + ترقيم صحيح). السعر ~$0.22/س batch — رخيص. > - بديل قوي: OpenAI gpt-4o-transcribe (اختُبر حياً: عربي مثالي؛ بعض البنشماركات الواقعية تضعه #1). للاستخدام اليومي المجاني: Groq whisper-large-v3 (يحتاج User-Agent header — Cloudflare 1010 بدونه). > - 🔴 الحركات/التشكيل (خط أحمر لد. وائل): لا أي STT عالمي يُخرج تشكيلاً — Scribe v2 + gpt-4o-transcribe + Whisper كلها تُخرج عربي بلا حركات (مؤكّد بالاختبار الحي، has_diacritics=False للجميع). ⇒ للحصول على مخرَج مُشكّل: pipeline = STT (Scribe v2) ثم تشكيل عبر skill arabic-tashkeel (CATT). لا حل آخر. > - التوصية: الدقة أولاً ⇒ Scribe v2 للمهام الحرجة (إملاء/تفريغ مهم) · Groq whisper (مجاني) للصوت الوارد اليومي · gpt-4o-transcribe co-option. التشكيل دائماً بخطوة CATT لاحقة.

Config: STT الوارد اليومي = Groq whisper-large-v3 (channel-agnostic). Scribe v2 متاح عبر ElevenLabs key للمهام الحرجة.

---

7️⃣ Scientific Research (PubMed/Cochrane/arXiv)

| المهمة | الأفضل | البديل | |---|---|---| | بحث طبي (RCT/meta) | PubMed + Claude Opus 4.7 reasoning | OpenFDA + Mistral medium | | Deep multi-source (Background) | Gemini Deep Research Max | Perplexity Pro Deep Research | | Standard Background Research | Gemini Deep Research | Tavily Search + Claude Opus | | Reasoning backbone (deep research synthesis) | Gemini 3.1 Pro Preview ⭐ | Claude Opus 4.8 / GPT-5.6 Sol | | Engineering research | Semantic Scholar + Claude Opus | Web search + Gemini 3.1 Pro 1M |

> ⚠️ gemini-3-pro-preview سُحب من API → HTTP 404 (verified live 2026-06-07). بديله الرسمي = gemini-3.1-pro-preview (HTTP 200). لا تستدعِ 3-pro-preview بعد الآن. > > 🧪 Head-to-head verified (2026-06-07): على مهمة deep-research هندسية صعبة (تكميم 3 مخاطر متفاعلة)، Gemini 3.1 Pro أنتج وحده "Interaction Penalty" منفصلاً (تفاعل غير خطي) + تصنيف established/assumptions صريح + تفكير عميق (1943 think tokens). تفوّق منهجي واضح على 3-flash. → ترقية مؤكَّدة كـ reasoning backbone للبحث العميق. | arXiv papers | Tavily search + Claude Opus | Perplexity | | General research | Tavily + Perplexity | Firecrawl + Claude |

Tier 1 sources: PubMed/Cochrane/WHO/CDC/NICE (medical) · ESC/ADA/ASCO (specialty) · Tier 1 journals (NEJM, JAMA, Lancet, BMJ)

---

8️⃣ Math & Logic

| المهمة | الأفضل | البديل | |---|---|---| | Symbolic math | Wolfram Alpha API + Claude Opus | SymPy local | | Numerical computation | Python (NumPy/SciPy) | code_execution xAI | | Proofs + reasoning | Claude Opus 4.7 | GPT-5.6 Sol | | Engineering calcs | ACI/Eurocode formulas + Python | Wolfram Alpha | | Stats/regression | statsmodels Python | quantstats |

---

9️⃣ Engineering (Civil/Structural/MEP) — موسّع 2026-06-05

> المرجع الكامل A→Z: ENGINEERING_ARSENAL_MATRIX.md · Router: bash scripts/capability_router.sh engineering <sub>

9.1 Civil Core — أفضل أداة + بديلنا الداخلي

| المهمة | الأقوى عالمياً | بديلنا الداخلي (skill) | Python/Free | |---|---|---|---| | Method Statement (KCPC) ⭐ | Opus 4.8 + خبرة د. وائل | civil-methodology-engine | — | | Planning / P6 / Schedule | Primavera P6 · ALICE · nPlan | p6-ai-planner (CPM+Monte Carlo) | XER parser | | Quantity Takeoff / BOQ | Togal.AI · Kreo · CostX | quantity-takeoff-engine | Gemini Vision + ezdxf | | Claims / EOT / FIDIC | SmartPM · nPlan · Bluebeam | claims-engineering | windows analysis | | Water/Wastewater Networks | OpenFlows · DHI MIKE | civil-networks | wntr(EPANET)+swmmio(SWMM) | | Bridges/Tunnels/Marine | CSiBridge · MIDAS · PLAXIS | bridge-tunnel-engine | numpy/scipy beam calc | | Blueprint OCR | LlamaParse · Mistral OCR 4 (mistral-ocr-latest) | engineering-ocr-blueprints | Mathpix+Gemini+ezdxf+ifcopenshell | | Routing هندسي | — | civil-design-router | reads MATRIX |

9.2 Foundation (متوفر ومُتحقّق)

| المهمة | الأداة | الحالة | |---|---|---| | 3D BIM/Model conversion | Autodesk APS (key ✅) | Model Derivative + Design Automation + Viewer | | Quick 3D concept/massing | Pascal Editor (free) | GLB/STL/OBJ | | Presentation/renders | Adobe (Firefly/PDF/Express, key ✅) | — | | Drawings DWG/DXF | ezdxf ✅ + Autodesk APS | — | | IFC / BIM models | ifcopenshell ✅ | — | | GIS / corridors / drainage | geopandas + rasterio + shapely ✅ | QGIS reference | | Power/Electrical نets | pandapower ✅ | ETAP/DIgSILENT reference | | Solar/PV | pvlib ✅ | — | | Math/structural verify | Wolfram + scipy + ACI/Eurocode | — |

9.3 Discipline Solvers — مرجعية/تكامل عند الحاجة (تجارية)


Bentley : OpenRoads · OpenBridge · OpenFlows · PLAXIS
CSI     : ETABS · SAFE · SAP2000 · CSiBridge
Trimble : Tekla Structures / Structural Designer
MEP     : Revit MEP · Carrier HAP · IESVE · EnergyPlus
السياسة: نبدأ بالبديل الداخلي + Python المجاني؛ نضيف التجاري فقط عند مشروع حقيقي يتطلبه.

Skills (الجديدة 2026-06-05): civil-methodology-engine · p6-ai-planner · quantity-takeoff-engine · claims-engineering · civil-networks · bridge-tunnel-engine · engineering-ocr-blueprints · civil-design-router Skills (السابقة): engineering-design-stack · pascal-editor · construction · construction-assistant

---

🔟 Medical

| المهمة | الأفضل | البديل | |---|---|---| | Lab interpretation | medical-arsenal skill (lab_interpreter.py) | Claude Opus + Mayo | | Drug lookup | OpenFDA + RxNav + DailyMed (free) | Claude + Drugs.com | | Drug interactions | RxNav (free) | DailyMed | | Patient info | MedlinePlus (free) | Mayo Clinic | | Clinical trials | ClinicalTrials.gov v2 (free) | Europe PMC | | Diagnosis support | ❌ لا أشخّص نهائياً | — |

Safety: Always Tier 1 source + disclaimer + Red flag alerts + ✆ 112 Kuwait emergency

---

1️⃣1️⃣ Economic & Financial

| المهمة | الأفضل | البديل | |---|---|---| | Markowitz portfolio | pypfopt + Claude Opus reasoning | — | | Stock prices | Yahoo Finance (free) | Polygon (مدفوع، تجنّب) | | Crypto prices | CoinGecko (free) | — | | FX rates | Frankfurter API + er-api (free) | — | | Economic data | FRED + World Bank + IMF + TCMB (all free) | — | | Turkish funds | TEFAS API (free) | — | | Forecasting | Prophet + Claude reasoning | ARCH (GARCH) | | Investment advisor weekly | weekly_investment_advisor.py cron | — |

---

1️⃣2️⃣ Legal — الترسانة القانونية (محدث 2026-06-05)

> المرجع الكامل: LEGAL_ARSENAL_MATRIX.md. ليست استشارة ملزِمة.

| المهمة | الأفضل | البديل | |---|---|---| | استدلال قانوني عميق / مذكرات | Claude Opus 4.8 (golden chain) | GPT-5.6 Sol · Opus 4.7 | | بنشمارك قانوني (LegalBench) | Gemini 3.1 Pro / 3.5 Flash (#1 LegalBench) | Opus 4.8 | | Bilingual legal (AR+EN) | Claude Opus 4.8 + legal-rag skill | GPT-5.6 Sol | | مراجعة عقود / Contract review | contract-review skill (Opus/Gemini) | Spellbook/Harvey (enterprise) | | صياغة / Legal drafting | legal-drafting skill + text-humanizer | Spellbook | | سوابق قضائية (US) | courtlistener-research (CourtListener — مجاني) | Westlaw/Lexis | | بحث مؤرّض (RAG) | legal-rag (Gemini 3.1 Pro + voyage-law-2) | — | | مطالبات FIDIC/EOT | claims-engineering + engineering-legal-economic | — | | Turkish legal docs (Tapu, Vekaletname) | Claude Opus 4.8 + ALKISHAWI transliteration | — | | Kuwait/GCC commercial law | Opus 4.8 + legal-rag + web_search | Perplexity legal | | Translation premium | translate skill (Opus tier, domain=legal) | Gemini 3.5 Flash |

---

1️⃣3️⃣ Programming/Coding — تحقيق شامل (محدّث 2026-05-22 مع MiniMax M2.7)

OpenAI Codex variants المتوفرة فعلاً عبر /v1/models:

gpt-5-codex, gpt-5.1-codex (+ max/mini), gpt-5.2-codex, gpt-5.3-codex ← الأحدث في فئة Codex
لا يوجد gpt-5.4-codex أو gpt-5.5-codex حتى الآن (OpenAI لم تصدرهم بعد)
GPT-5.4 + GPT-5.5 (chat) موجودان لكن بدون codex variant

🆕 MiniMax M2.7 (مارس 2026 — open-weight SOTA للـ coding):

230B params total · 10B active (MoE) · 205K context
SWE-Bench Verified: 78% ≈ Claude Opus 4.6
SWE-Pro: 56.22% · VIBE-Pro: 55.6% (end-to-end project delivery)
AIME: 78.3% · GPQA: 82%
سعر: $0.30/M in, $1.20/M out (standard) — أو $0.60/$2.40 (highspeed ~100 tok/s)
الميزة الفريدة: ~5 review fixes/session (vs Kimi K2.5 ~50) → الأقل أخطاء و الأكثر حذراً
⚠️ بدون image input · ⚠️ Weights non-commercial (API commercial OK)
✅ مُسجّل في models.json تحت 4 endpoints (minimax/cn/portal/portal-cn) — Anthropic-compatible

| المهمة | الأفضل | البديل #1 | البديل #2 (رخيص) | |---|---|---|---| | Frontier Codex agentic CLI | gpt-5.3-codex | Claude Opus 4.7 (Claude Code) | MiniMax M2.7 ⭐ | | Multi-file refactoring (complex) | GPT-5.6 Sol (chat) | Claude Opus 4.7 | gpt-5.3-codex | | Managed Agent Sandbox | Antigravity Managed Agent (US Region) | — | — | | Best coding SOTA | gpt-5.3-codex + Claude Opus 4.7 (tie) | MiniMax M2.7 (open SOTA) | DeepSeek V4 Pro | | Privacy/Sensitive code (KCPC) | MiniMax M2.7 (open-weight, China-hosted) | DeepSeek V4 Pro | local Qwen via Ollama | | Background agentic batch | MiniMax M2.7-highspeed (~100 tok/s، رخيص) | Kilo CLI (KiloCode) | Claude Haiku 4.5 | | Cost-optimized coding | MiniMax M2.7 ($0.30/$1.20) | DeepSeek V4 Flash (deepseek/deepseek-v4-flash ~$0.0028/M — #2 مُثبّت 2026-07-22 بقرار د. وائل: أرخص 50× للخلفية كثيفة التوكنات، سياق 128K) | Claude Haiku 4.5 | | Conservative low-error refactor | MiniMax M2.7 (~5 fixes/session) | Claude Opus 4.7 | gpt-5.3-codex | | Algorithmic/competitive (LiveCodeBench) | Kimi K2.6 | DeepSeek V4 Pro | gpt-5.3-codex | | 1M context tasks | DeepSeek V4 Pro (1M ctx) | Gemini 3.1 Pro Preview (1M) | — | | Quick fixes | Claude Sonnet 5 | Gemini 3.5 Flash | MiniMax M2.7-highspeed | | Test generation | TestSprite MCP | — | — | | Code review | Claude Opus + requesting-code-review skill | gpt-5.3-codex | MiniMax M2.7 | | Multimodal coding (UI screenshots) | Claude Opus 4.7 Vision | Gemini 3.1 Pro Vision | ❌ MiniMax (no image) |

🎯 موقع MiniMax M2.7 في الترسانة:

Tier 1 (Frontier): gpt-5.3-codex + Claude Opus 4.7 — للمهام الحساسة جداً والتسليمات النهائية
Tier 2 (Best-Value Open): MiniMax M2.7 ⭐ — جودة Opus 4.6 بـ 1/30 السعر — للـ batch + background + privacy + cost
Tier 3 (Algorithmic/Long Context): Kimi K2.6 + DeepSeek V4 Pro — للحالات المتخصصة
Tier 4 (Quick/Cheap): Claude Sonnet 5 + Haiku 4.5 + DeepSeek V4 Flash

لماذا 5.3 وليس 5.5؟ OpenAI لم تطلق codex 5.4 أو 5.5. حُقّق مباشرة عبر /v1/models. للـ chat الأحدث = GPT-5.6 Sol (مستخدم في fallback chain).

weekly_arsenal_audit سيرصد أي codex أحدث + إصدارات MiniMax الجديدة (M2.8?) فور إصدارها + يحدّث config تلقائياً + يبلّغ Telegram.

Pipeline (mandatory): Superpowers (brainstorming→writing-plans→TDD→verification) + TestSprite final gate

---

1️⃣4️⃣ Translation

| المهمة | الأفضل | البديل | |---|---|---| | Quick (Google quality) | translate.py --quality quick (free) | Gemini 3.5 Flash | | Standard (Gemini Pro) | translate.py --quality standard | Mistral medium | | Premium (engineering/legal/medical) | translate.py --quality premium (Claude Opus) | Sonnet 5 | | Bilingual presentation | Claude Opus | Gemini 3.5 Flash |

Replaces: DeepL Pro ($25/m) — رفضناه، عندنا بديل أقوى ومجاني

---

1️⃣5️⃣ Document Analysis

| المهمة | الأفضل | البديل | |---|---|---| | PDF analysis | Claude Opus 4.7 (native PDF) | Gemini 2.5 Pro | | Arabic OCR | Mistral OCR 4 (mistral-ocr-latest, primary) · Tesseract 5.5 (ara+eng) | Mathpix (math) | | Math equations OCR | Mathpix | — | | DOCX/PPTX/XLSX | python-docx/pptx/openpyxl | LibreOffice headless | | DMS for KCPC | paperclip skill (R2+LanceDB+Voyage embeddings) | — |

Config: pdfModel.primary = Claude Opus 4.7 ✅ (6 fallbacks)

---

1️⃣6️⃣ Vision (Image Understanding)

| المهمة | الأفضل | البديل | |---|---|---| | General vision | Gemini 3.1 Pro Preview | Claude Opus 4.7 | | Face recognition (family) | Claude Opus 4.7 vision | GPT-5.6 Sol | | Quiz/puzzle photos | Gemini 3.1 Pro (fast) | Claude Opus (complex) | | OCR + structured | Mathpix (math) + Claude | Tesseract |

Config: imageModel.primary = Gemini 3.1 Pro Preview ✅

---

1️⃣7️⃣ Web Search & Scraping

| المهمة | الأفضل | البديل | |---|---|---| | Search general | Tavily Search (basic→advanced) | Firecrawl Search | | AI summary search | Perplexity sonar | Tavily with answer | | JS-heavy/bot-protected | Firecrawl Scrape (stealth proxy) | Oxylabs | | Quick fetch | web_fetch tool | — | | Stealth scraping | skills/stealth-browser (Playwright+Oxylabs) | Firecrawl stealth | | Apify scrapers | Apify (instagram, twitter, etc.) | — | | X/Twitter | x_search (xAI) | Apify |

---

1️⃣8️⃣ Embeddings & Memory

| المهمة | الأفضل | البديل | |---|---|---| | Multilingual (AR+EN) | Voyage-3 (1024-dim) | OpenAI text-embedding-3-large | | Code embeddings | Voyage-code-3 | — | | Multimodal | Voyage-multimodal-3 | — | | Memory backend | LanceDB (local) | — | | RAG over docs | Paperclip skill + Voyage | — |

---

1️⃣9️⃣ Office & Productivity

| المهمة | الأفضل | البديل | |---|---|---| | Microsoft 365 (Hotmail+Business) | m365.py skill (Graph API) | — | | Google Workspace | gog CLI (10 services) | — | | Calendar | gog calendar + m365.py | — | | Tasks | m365.py tasks (To Do) | — | | OneDrive | m365.py drive | — | | Email send | m365.py mail send | gog gmail send |

---

2️⃣0️⃣ Specialized Skills (66+ available)

Engineering/Construction: engineering-design-stack · construction · construction-assistant · pascal-editor · paperclip Finance/Investment: investment-analyst · stocks-enhanced · crypto-market · economic-calendar · portfolio-watcher · ai-investment-analyzer · tradingview-webhooks · turkey-real-estate · kuwait-data Medical: medical-arsenal · medical-triage Productivity: microsoft365 · onedrive · notion · linear · taskflow · langfuse Translation/Voice: translate · cartesia (ref) · openai-whisper-api · realtime-voice · vapi · twilio Voice for Wael: Eric (default) · WAEL HD v2 (cloned) · HeyGen Avatar Research: in-depth-research (Deep Research) · briefing · web-search · forecasting-techniques · math-foundation Misc: stealth-browser · web-scraper · video-frames · gifgrep · pdf-summarizer · text-humanizer · self-improvement

---

🔄 Update Workflow (أسبوعي إلزامي)

كل يوم أحد 05:00 الكويت: 1. weekly_arsenal_audit.sh يفحص: - Anthropic releases (claude.ai/releases) - OpenAI model list (api.openai.com/v1/models) - Google AI (ai.google.dev/models) - xAI (api.x.ai/v1/models) - DeepSeek, Moonshot, Mistral, Voyage, ElevenLabs releases - GitHub releases for Claude Code, Codex CLI, Kilo, OpenClaw, MCP servers 2. يقارن مع memory/arsenal-state.json (الحالة المعروفة) 3. لو في: - Model جديد في فئة → يبحث benchmarks (LMArena, Aider, SWE-bench, MMLU) - Version جديدة لـ CLI/tool → يحدّث آلياً - API endpoint جديد → يضيفه للترسانة 4. يحدّث DOMAIN_MODEL_RANKINGS.md إذا في تغيير ranked 5. يرسل تقرير لـ د. وائل: ما الجديد، ما تغيّر، ما هو الـ recommended upgrade

يدوياً عند الحاجة:

bash
bash scripts/weekly_arsenal_audit.sh

---

🔒 Locked Rules

1. لا نتوقف أبداً — fallback chain لكل model (config-enforced) 2. الأفضل دائماً — primary في كل domain يطابق هذه المصفوفة 3. مجاني قبل مدفوع عند تساوي الجودة 4. Benchmark-driven — أي تغيير ranked يلزم بنشمارك موثق 5. Pin to config — أي domain ranking → primary مكتوب في openclaw.json (verify_agreements section 10) 6. Audit weekly — مفروض بـ cron (لا حاجة لتذكير من د. وائل)

---

🎯 v2 UPDATE — 2026-05-24 (Media Golden Chains — M-026 Phase 2)

> مصدر التحقق: live probe /tmp/probe_phase2.txt (2026-05-24 21:17 GMT+2) > موافقة د. وائل: audio msg #3603 (3 critical fixes + 4 upgrades + Hedra confirmed) > مفاتيح مفقودة من env.sh: Cartesia, Synthesia, D-ID, Suno, Udio, Sync.so, DeepL → مرفوعة من السلاسل

🖼️ Image — v3 (محدّث 2026-06-16 — Artificial Analysis live + Google email migration)

> مصدر: Artificial Analysis Text-to-Image leaderboard (live 2026-06-16) + Google AI Studio migration email (Imagen 4 → Gemini 3.1 Flash Image قبل 17 أغسطس 2026)

1. OpenAI gpt-image-2-2026-04-21 — #1 عالمياً (Elo 1339)، وجوه حقيقية، أعلى دقة ✅ verified 2. OpenAI gpt-image-1.5 — #2 عالمياً (Elo 1267)، transparent background ✅ verified 3. Google gemini-3.1-flash-image (Nano Banana 2) — #4 عالمياً (Elo 1257)، production، أسرع، أرخص ($67/1k) ✅ verified — بديل Imagen 4 المعتمد من Google 4. Google nano-banana-pro-preview (Gemini 3 Pro Image) — #6 عالمياً (Elo 1219)، studio-quality high control ✅ verified 5. Google gemini-3-pro-image — high quality fallback ✅ verified (API live) 6. xAI grok-imagine-image-quality — #9 عالمياً (Elo 1204)، fast paid ✅ verified 7. OpenAI gpt-image-1-mini — ultra-cheap concepts ✅ verified 8. MiniMax image-01 — bulk non-face (~$0.0035) ✅ verified 9. Replicate Flux models — free fallback

*⚠️ Imagen 4 (imagen-4.0-) يُسحب 17 أغسطس 2026 → استبدل بـ gemini-3.1-flash-image (نفس السعر، أعلى ترتيباً). لا تبعية تنفيذية عندنا = صفر خطر.

Notes: الوجوه الحقيقية → دائماً #1 (GPT-image-2). حتى 5 صور مرجعية.

🎬 Video Text-to-Video — v3 (محدّث 2026-06-16 — Seedance 2.0 مُفعّل — سد فجوة #1)

> مصدر: Artificial Analysis Text-to-Video (With Audio) leaderboard — live 2026-06-16 > ✅ فُعّل Seedance 2.0 (#1 عالمياً) عبر PiAPI — auth verified zero-spend 2026-06-16. الترسانة الآن تمسك القمة العالمية.

1. PiAPI seedance-2 (Seedance 2.0) ✅ verified — #1 عالمياً (Elo 1217)، skill frontier-video 2. Google veo-3.1-generate-preview ✅ verified — #8 عالمياً (Elo 1093)، أقوى Google، سينمائي + صوت 3. Google veo-3.1-fast-generate-preview ✅ verified — #9 عالمياً (Elo 1087) 4. OpenAI sora-2-pro ✅ verified 5. Google veo-3.1-lite-generate-preview — #10 عالمياً (Elo 1083)، رخيص ($4.80/min) 6. Kling 3.0 Omni (PiAPI #5-6) · MiniMax Hailuo 2.3 · LTX-2.3 Pro

البدائل العليا عبر PiAPI/Fal: HappyHorse-1.0 (#2, audio+lip-sync) · SkyReels V4 (#3) · Kling 3.0 Pro (#4).

🎞️ Video Image-to-Video — v3 (محدّث 2026-06-16 — Seedance 2.0 #1 + Grok v1.5 #2)

> مصدر: Artificial Analysis Image-to-Video (With Audio) leaderboard — live 2026-06-16

1. PiAPI seedance-2 (Seedance 2.0) ✅ verified — #1 عالمياً (Elo 1194)، first_last_frames / omni_reference (12 مرجع)، skill frontier-video 2. xAI grok-imagine-video-1.5-preview ✅ verified (API live 2026-06-16) — #2 عالمياً (Elo 1114)، أحدث نسخة (مايو 2026) 3. xAI grok-imagine-video ✅ verified — #5 عالمياً (Elo 1082)، النسخة السابقة (fallback رخيص $4.20/min) 4. Google veo-3.1-generate-preview — #4 عالمياً (Elo 1088)، fallback عالي الجودة + صوت 5. Hedra Character 3 ✅ verified (HTTP 200) — talking image fallback 6. PixVerse V6 (#8) · Kling 3.0 (#9-10) · MiniMax Hailuo 2.3 Fast

⚠️ القاعدة الجديدة لـ I2V: Seedance 2.0 أولاً (#1) → إن أردت xAI: استخدم grok-imagine-video-1.5-preview (ليس القديم grok-imagine-video).

👤 Talking Avatar (Wael Digital Twin) — v2

1. HeyGen Custom Avatar c6a8b1b1a585404c81361eca7f900b70 + ElevenLabs WAEL_HD_v2 — #1 ثابت 2. Hedra Character 3 ✅ key verified live ⭐ مضاف صراحة (fallback مؤكد) 3. HeyGen Photo Avatar IV — للصور فقط 4. ~~Synthesia~~ — 🔴 UNAVAILABLE (لا مفتاح في env.sh) — FUTURE

💋 Lip-sync Standalone — v2 (جديد)

1. Replicate sync/lipsync-2 ✅ verified (version 3190ef7dc0cb…) ⭐ جديد 2. Hedra Character 3 ✅ verified — lip-sync ممتاز 3. HeyGen Photo Avatar IV 4. ~~Sync.so~~ — 🔴 لا مفتاح

🎵 Music — v2

1. Google lyria-3-pro-preview ✅ verified — #1 سينمائي 2. MiniMax music-2.6 ✅ — Limited FREE ⭐ 3. Google lyria-3-clip-preview — clips قصيرة 4. Replicate music models (musicgen) — fallback مجاني 5. MiniMax music-2.0 — batch رخيص ($0.03/5min) 6. ~~Suno / Udio~~ — 🔴 لا مفاتيح

🗣️ TTS Arabic — v3 ⭐ CRITICAL (محدّث 2026-06-30 — سلسلة never-stop مُختبرة حيّاً بالكامل)

الرد الصوتي اليومي العربي = البوابة الوحيدة scripts/media_say.sh (تبدأ بـ Charon المقطّع + بوابة تأكيد المحرّك قبل الإرسال). الترتيب حسب دقّة العربية لا الـElo العام:

1. Gemini 3.1 Flash TTS (Charon) ✅ مُختبر — عربي أصلي + تشكيل، #2 عالمي، أرخص 5×. [مقطّع — يمنع انهيار مهلة 90s على النص الطويل] 2. Gemini 2.5 Flash TTS (Charon) ✅ مُختبر — نفس عائلة Google، عربي أصلي، مجاني — أفضل احتياطي بنفس الجودة (مدمج داخل مولّد Charon المقطّع) 3. ElevenLabs eleven_multilingual_v2 ✅ مُختبر — premium متعدّد اللغات 4. OpenAI gpt-4o-mini-tts (onyx) ✅ مُختبر 2026-06-30 — رخيص 5. MiniMax speech-2.8-hd + language_boost:Arabic + Arabic_CalmWoman ✅ مُختبر 2026-06-30 — عربي صحيح (✅ أُصلح من صوت male-qn-qingse الصيني الكارثي) 6. xAI TTS ara — عام لا عربي-أصلي — آخر السلسلة

> 🔴 أُزيل (2026-06-30 — تحقّق حي): Groq playai-tts-arabic (decommissioned) + canopylabs/orpheus-arabic-saudi (يتطلّب قبول شروط من الكونسول — غير متاح برمجياً). التوثيق القديم كان بائداً. > ElevenLabs (Eric/WAEL_HD) = للأعمال الاحترافية/الصوت المستنسخ فقط (عند الطلب الصريح)، لا للرد اليومي.

سياسة الـfallback (never-stop): كل طبقة مهلتها 60s؛ أي فشل/مهلة → تبديل فوري للتالي، بلا انتظار. بوابة التحقّق تسجّل المحرّك الفعلي (tts_engine_confirm.log)، وإن هبط عن Charon تُطلق تحذيراً — لا تسليم صامت.

قاعدة إلزامية: قبل أي TTS عربي → CATT Tashkeel (skills/arabic-tashkeel/).

🎙️ STT Arabic — v2

1. OpenAI gpt-4o-mini-transcribe-2025-12-15 ✅ verified ⭐ NEW SKU 2. OpenAI gpt-4o-transcribe-diarize ✅ verified — multi-speaker 3. Groq whisper-large-v3-turbo ✅ verified — ultra-fast FREE 4. AssemblyAI Universal-2 — best diarization paid 5. Deepgram Nova-3 — real-time stream 6. xAI stt

🔬 Research — v2 (محدّث 2026-06-04 — Benchmarks حيّة)

Deep Research Agents (تقارير عميقة متعددة المصادر):

1. Google deep-research-max-preview-04-2026 ✅ verified ⭐ #1 (DRACO/نصي عميق) 2. Google deep-research-pro-preview-12-2025 ✅ verified 3. Perplexity sonar-deep-research (DRACO benchmark — Perplexity+Harvard) 4. Manus 1.6 ✅ integrated/live (TVIR-Bench: Manus 68.0 = أقوى commercial) — skill: skills/manus-agent/, API verified via x-manus-api-key. 5. Genspark ⚠️ key present but no validated public API endpoint (blocked until official enterprise base URL/docs). 6. Skywork ⚠️ skill built; upstream still HTTP 503 ALB (server-side outage, not auth yet). 7. Hermes Agent (NousResearch, محدّث 2026-06-04) — self-hosted multi-workstream
TVIR-Agent (arXiv 2606.02320, يونيو 2026):

إطار بحثي أكاديمي (ليس أداة جاهزة) — يُبنى على backbone LLM.

TVIR-Agent (Qwen3-Max) = #2 overall (74.13 ZH) — الـ backbone (Qwen3.7-Max) موجود عندنا في السلسلة الذهبية (mulerouter/qwen3.7-max + qwen-codingplan/qwen3.7-max).

البديل العملي: Tongyi DeepResearch (Alibaba-NLP, open-source, MIT) — متاح عبر OpenRouter (alibaba/tongyi-deepresearch-30b-a3b) بلا GPU. نملك OPENROUTER_API_KEY ✅.

Web Search APIs (Benchmark aimultiple يونيو 2026 — Agent Score):
| # | API | Agent Score | عندنا؟ | |---|---|---|---| | 1 | Brave Search | 14.89 | ✅ BRAVE_API_KEY | | 2 | Firecrawl | 14.58 | ✅ FIRECRAWL_API_KEY | | 3 | Exa | 14.39 | ❌ (Brave أقوى — تُجاهل إلا للبحث الدلالي/find-similar) | | 5 | Tavily | 13.67 | ✅ TAVILY_API_KEY | | 7 | Perplexity | 12.96 | ✅ PERPLEXITY_API_KEY |

Exa decision (2026-06-04): نملك Brave (#1) + Firecrawl (#2) أقوى من Exa (#3). Exa ميزته الفريدة = neural "find similar" للأوراق. التوصية: تجاهله (لا يضيف جديداً جوهرياً). Semantic Scholar API = مجاني بلا مفتاح (مستخدم في medical-arsenal) — للأوراق الأكاديمية دون شراء.

💻 Code — v2 (محدّث 2026-06-17 — GLM-5.2)

1. Claude Opus 4.8 — #1 reasoning + tools (primary) 2. Claude Opus 4.7 — #2 reasoning + tools 3. OpenAI gpt-5.6-sol ✅ — general code قمة 4. OpenAI gpt-5.1-codex-max ✅ verified — code-specialized 4b. OpenAI gpt-5.3-codex ✅ verified — general code 5. evolink/glm-5.2 ⭐ NEW (2026-06-17) — أقوى مفتوح المصدر للترميز عالمياً (#2 Code Arena Frontend 1,595 Elo · AA Index 51 · يتفوّق على Opus 4.7/4.8 في الواجهات · Terminal-Bench 81.0 · FrontierSWE 74.4 ≈ Opus 4.8). القناة الأساسية Evolink (✅ live) + احتياطي openrouter/z-ai/glm-5.2 (1M ctx، ✅ live). 6. Moonshot kimi-k2.6 — open SOTA 7. DeepSeek v4-pro 8. Mistral mistral-medium-2604 ✅ verified 9. Mistral codestral-2508 ✅ verified — code-specialized 10. Z.ai glm-5.1 (مهجور — حلّ محلّه glm-5.2؛ القناة zai/ ميتة بلا رصيد)

> ⚠️ حيث ما زال GLM-5.2 أضعف: المهام الماراثونية فائقة الطول (SWE-Marathon 13.0 مقابل Opus 4.8 = 26.0 · NL2Repo 48.9 مقابل 69.7). للترميز الوكيلي طويل المدى الأصعب يبقى Opus 4.8 الأقوى. للواجهات + الترميز العام GLM-5.2 ممتاز ورخيص ($1.40/$4.40 لكل M).

🧊 3D — v2 (لا تغيير)

Replicate Hunyuan3D · Tripo3D · PiAPI.

📄 OCR — محدّث 2026-06-28 (Mistral OCR 4 = primary)

Mistral OCR 4 (mistral-ocr-latest يشير له تلقائياً) = الأساسي للمستندات العربية+الإنجليزية+الجداول · MinerU 3.4 (FREE offline) لـ English/mixed + جداول معقّدة + خصوصية KCPC (صفر سحابة) · LlamaParse للمعقّد/المخططات · Gemini 3.1 Pro Vision · Tesseract 5.5 (ara+eng) محلي مجاني · Mathpix (math). السكربت document-ocr-arsenal/ocr_router.py يستدعي mistral-ocr-latest (= OCR 4) ويضمّ MinerU كمحرك offline (5 محركات). MinerU (.venvs/mineru، mineru_engine.py، pipeline=CPU / vlm=GPU-RunPod، --no-formula --fix-arabic، مُختبَر 2026-07-18 على كشف KFH). بنشمارك عربي حيّ: انظر memory/2026-06-28.md.

🌐 Translation — v2 (لا تغيير)

translate.py (Gemini → Claude → DeepSeek). ~~DeepL~~ — 🔴 لا مفتاح.

---

🔷 v3 UPDATE — 2026-05-31 (Full Arsenal Scan + Global Ranking — 5 parallel research agents)

> مسح حي كامل + بحث عالمي موثّق. المرجع التفصيلي: GLOBAL_RANKING_COMPARISON_2026-05-31.md + ARSENAL_SCAN_2026-05-31.md.

🎬 Video T2V/I2V — v3 ⭐ تغيير جوهري (Frontier)

اكتشاف: المتصدّران عالمياً (Artificial Analysis Video Arena) أصبحا في متناولنا:

Seedance 2.0 (ByteDance) — #1 عالمياً: T2V Elo 1213 · I2V Elo 1187. عبر PiAPI (نملك المفتاح ✅). models: seedance-2 ($0.10/s), seedance-2-fast ($0.08/s). أوضاع: text_to_video / first_last_frames / omni_reference (12 مرجع).

HappyHorse-1.0 (Alibaba) — #2 عالمياً: T2V 1212 (no-audio 1333) · I2V 1171. عبر FAL (مفتاح شغّال ✅). models: alibaba/happy-horse/{text-to-video,image-to-video,reference-to-video}. joint audio-video + best multilingual lip-sync.

Skill جديد: skills/frontier-video/ (SKILL.md + seedance.py + happyhorse.py — auth مختبر حياً).

الترتيب الجديد T2V: Seedance 2.0 (PiAPI) → HappyHorse (FAL) → Veo 3.1 (Google) → Kling 3.0 → Grok Imagine. الترتيب الجديد I2V: Seedance 2.0 → HappyHorse → Grok Imagine (#3, نملكه) → Veo 3.1 Fast → Kling. HappyHorse للفيديو الناطق بالعربي: joint audio + lip-sync متعدد اللغات = مرشّح قوي مع ElevenLabs/MiniMax.
🔬 Academic Research — v3 (جديد)

أدوات SaaS (Elicit/Consensus/Scite/OpenEvidence) كلها مدفوعة/مقيّدة (OpenEvidence للأطباء فقط بلا API عام). بنينا البديل المجاني المكافئ (~90%):

Skill جديد: skills/academic-research/

- lit_search.py (بديل Elicit) — OpenAlex + Europe PMC + Crossref + arXiv + Semantic Scholar (مجاني، مختبر حياً) - consensus_check.py (بديل Consensus) — جلب أوراق + حكم Gemini/Claude على SUPPORT/CONTRADICT + نسبة إجماع - medical_evidence.py (بديل OpenEvidence) — PubMed + Europe PMC + تلخيص مدعوم بالاستشهادات + disclaimer

توصية مفتاح مجاني: SEMANTIC_SCHOLAR_API_KEY (للموثوقية، يتجنب 429 rate-limit).

🧭 Per-Domain Routing — v3 (توجيه ذكي لموديلات نملكها)

| المجال | وجّه إلى | المصدر | |---|---|---| | قانوني معقّد | Gemini 3.1 Pro | #1 LegalBench (110 موديل) | | مالي معقّد | GPT-5.2 (أعلى GPT متاح) | GPT-5.x #1 Vals finance | | طبي حرج | GPT-5.2 + Claude (second opinion) | GPT-5.x حد أعلى HealthBench | | رياضي/علمي | Claude Opus 4.8 + Wolfram إلزامي | Claude 94.2% GPQA | | بحث آني | gpt-5-search-api + Perplexity sonar | top-4 + أدق factual |

✅ تصحيح ذاتي — v3.1 (2026-05-31)

خطأ سابق صُحّح: ادّعيت أن gpt-5.6-sol غير موجود — كان خطأ منهجياً (اعتمدت /v1/models list بدل اختبار chat فعلي). الحقيقة (مُختبَرة chat حي):

gpt-5.5 ✅ يعمل (gpt-5.5-2026-04-23) · gpt-5.5-pro ✅ (عبر /v1/responses) · gpt-5.4 ✅ · gpt-5.2 ✅ · gpt-5.3 ❌ محذوف.

السلسلة الذهبية في openclaw.json (محدّث 2026-07-10): fallback #3 = openai/gpt-5.6-sol · #7 = openai/gpt-5.6-terra (حلّا محل gpt-5.5 / gpt-5.5-pro المكسور).

الدرس: اختبار الاستدعاء الفعلي (chat/responses) > قائمة /v1/models. القائمة قد لا تعرض الأحدث في المقدمة.

🆕 v4 UPDATE — 2026-06-13 (مسح حي كامل للـ APIs الثلاثة)
مسح حي لـ /v1/models (Anthropic + OpenAI + Google) + تصنيف بالقدرة + مقارنة بالترسانة.
🟢 NEW — Gemini 3.5 Live Translate (مفعّل 2026-06-13)

gemini-3.5-live-translate-preview — ترجمة صوتية حية ثنائية الاتجاه (bidiGenerateContent، WebSocket Live API).

16K in / 32K out. يترجم الكلام المنطوق فورياً صوت↔صوت/نص.

skill: skills/gemini-live-translate/SKILL.md (stub جاهز — يحتاج WebSocket session للتشغيل الحي).

الاستخدام: ترجمة فورية في المكالمات/الاجتماعات (عربي↔إنجليزي/تركي/...).

📊 خلاصة المقارنة — لا فجوات جوهرية

Chat: primary = Opus 4.8 (أحدث متاح). Fable 5/Mythos 5 → watchlist (gated، 2× سعر).

Image: #1 عالمياً = GPT Image 2 (Elo 1338) ✅ عندنا · Nano Banana Pro ✅ مرصود (ليس #1).

Video: Veo 3.1 + Sora 2 Pro ✅ · Music: Lyria 3 Pro ✅ · TTS: ElevenLabs v3 + gemini-3.1-flash-tts ✅

STT: Groq whisper-v3 + gpt-4o-transcribe-diarize ✅ · Embeddings: gemini-embedding-2 (ترقية متاحة).

المفقود المفيد: ✅ كله فُعّل (2026-06-13):

- gemini-3.5-live-translate-preview → skill gemini-live-translate (#1 ترجمة صوتية حية) - gpt-realtime-translate → skill openai-realtime-translate (#2 بديل) - gemini-embedding-2 (3072 dims) → skill gemini-embedding-2 (default للفهرسة الجديدة؛ الفهارس القديمة تحتاج reindex)
🔑 حالة المفاتيح — v3 (مسح حي bash)
🟢 شغّال+رصيد: Anthropic · OpenAI · Gemini · Grok · DeepSeek · Groq · Perplexity · Mistral · MuleRouter (mulerouter/qwen3.7-max مربوط chat #5 + qwen vl/omni/plus) · MiMo Token Plan · FAL (fal-ai/wan/v2.7 فيديو + fal-ai/qwen-image صور — مربوطان 2026-06-04) · PiAPI

🔴 يحتاج إجراء: Z.ai/GLM (شحن) · Kimi/Moonshot (مفتاح منتهي — بديل عبر MuleRouter) · Qwen Direct (تفعيل — بديل عبر MuleRouter) · MiMo PAYG (شحن — بديل Token Plan)

---
🔐 Verification / Utility Layer — Sonjj API (added 2026-06-16)

Domain: email/account/phone/card/IP verification · disposable-domain detection · temp-mail + OTP capture (real Gmail/Outlook pool) · lightweight SEO recon · fake-user-data generation · HTML→Markdown · lunar date.

| Need | Tool (الأفضل لدينا) | الأمر | |---|---|---| | التحقق من إيميل/Gmail/Outlook حقيقي | Sonjj check-email/check-gmail/check-microsoft | skills/sonjj-api | | كشف نطاق disposable (anti-fraud) | Sonjj disposable (0.05 cr — أرخص شيء) | skills/sonjj-api | | إيميل مؤقت لاستقبال OTP (يمر فلاتر التسجيل) | Sonjj gmail-random ثم wait-otp | skills/sonjj-api | | تحقق رقم هاتف (E.164/دولة/منطقة زمنية) | Sonjj phone (0.03 cr، libphonenumber offline) | skills/sonjj-api | | تعريف BIN بطاقة (بنك/براند/دولة) | Sonjj bin | skills/sonjj-api | | IP geolocation | Sonjj iplookup | skills/sonjj-api | | SEO: Moz DA/PA · Ahrefs · Google index · backlink | Sonjj moz/ahrefs/index/backlink | skills/sonjj-api |

Billing: key واحد + محفظة credits واحدة، الخصم فقط عند HTTP 200، credits لا تنتهي. $1/1,000 cr → $0.30/1,000 في الباقة الكبرى. مفتاح في env.sh (SONJJ_API_KEY). Skill كامل: skills/sonjj-api/SKILL.md · client: skills/sonjj-api/scripts/sonjj.py (شغّله بـ /usr/bin/python3). Cloudflare 1010 يحجب UA الافتراضي — الـ client يرسل UA متصفح. ملاحظة: استقبال SMS (smser.net) منتج منفصل، غير مكشوف بهذا المفتاح.

🆕 2026-06-21 Live Scan Additions (tested via our own keys)

grok-build-0.1 (xAI) — fast agentic CODING model, MCP-native. TESTED ✅ (valid Python fib one-liner, 2244 tok). Placement: Coding tier — fast/agentic option; benchmark vs GPT-5.6 Sol / GLM-5.2 / Kimi K2.7 Code before final rank. NOT inserted into main reasoning golden fallback chain.

mistral-ocr-3 (Mistral) — OCR. TESTED ✅ on KFH page (Arabic+English+tables extracted accurately). Placement: document-OCR arsenal — strong #1/#2 candidate for Arabic+EN docs; A/B vs LlamaParse on a real method statement before final rank.

gemini-3-pro-image / gemini-3.1-flash-image (Google / OpenRouter) — image gen. Placement: image rankings — A/B vs GPT-image-2 (faces) & Gemini 3.1 Flash (general).

Gemini Omni (Google, I/O 2026, blog.google confirmed) — any-to-any world model (image/video/edit/physics sim), Vertex-backed. HIGH value multimodal/video. Access likely needs Vertex/GCP service account → evaluate. STATUS: watchlist→evaluate.

Kimi K2.7 Code / -highspeed** (Moonshot, ~$95/M) — fast cheap coding tier — evaluate.
Monitoring sources to add to weekly audit: llm-stats.com/llm-updates · evertune.ai ai-model-tracker (hourly trackers).

🦾 ملاحظات د. وائل