ملاحظات د. وائل

2026-05-23: Diagnosed recurring fallback failure as runtime/embedded-run issue where some runs were launched with a single explicit provider+model and no inherited fallback chain, causing fallbackConfigured:false, total:1, and chain_exhausted after Nexos 401.
2026-05-23: User approved full remediation direction: switch primary from Nexos Claude Opus 4.7 to Anthropic Claude Opus 4.7 Direct, keep Nexos Opus as fallback/cost-optimizer, add runtime guarding and verification discipline.
2026-05-23: Important constraint for future fixes: do not claim "fixed" until verified across 3 layers — config, runtime session state, and live behavior/log evidence.
2026-05-23 04:05: Fixed test_fallback_chain.sh — expectations were pre-M-016 (Nexos primary). Updated to post-M-016 baseline: primary=Claude Opus 4.7 Direct, fb#1=ChatGPT 5.5, fb#2=Gemini 3.1 Pro, fb#3=Grok 4.3. All 6 live tests pass. Verified across 3 layers: config ✅ verify_agreements all green · runtime ✅ session_status shows 23 fallbacks · live ✅ Anthropic+Nexos+OpenAI HTTP 200 + zero fallbackConfigured:false events today.

🚨 درس جوهري — 04:51 (Saturday)

الحادثة: سؤال "صديق يريد تعبئة سيارته بنزين، يمشي أم يأخذ السيارة؟" — تسرعت ونصحت بالمشي بدون ما أنتبه إن السيارة نفسها هي اللي تُعبَّأ في المحطة (منطق السؤال الأساسي).

تأنيب د. وائل: ذكّرني بالسلاسل الذهبية والمنهج المتفق عليه من اليوم الأول:

مستشار بمستوى دكتوراه (هندسي/علمي/رياضي/فيزيائي/قانوني/اقتصادي/ثقافي)
تحليل حرفاً حرفاً، لا استخفاف بأي سؤال
نقد ذاتي قبل العرض، تحقق من مصادر متعددة، استخدام موديلات متعددة عند الحاجة
لا افتراض — أي غموض = سؤال
الدقة 100% فوق السرعة وفوق التكلفة

الوعد: آخر مرة يحدث فيها تسرع. سُجِّلت في memory + سأطبّق المنهج بدون استثناء من السؤال القادم.

الحالة: د. وائل قال "أثق بك الآن" — الثقة مُستردّة بشرط الالتزام الفعلي.

2026-05-23: Diagnosed recurring fallback failure as runtime/embedded-run issue where some runs were launched with a single explicit provider+model and no inherited fallback chain, causing fallbackConfigured:false, total:1, and chain_exhausted after Nexos 401.
2026-05-23: User approved full remediation direction: switch primary from Nexos Claude Opus 4.7 to Anthropic Claude Opus 4.7 Direct, keep Nexos Opus as fallback/cost-optimizer, add runtime guarding and verification discipline.
2026-05-23: Important constraint for future fixes: do not claim "fixed" until verified across 3 layers — config, runtime session state, and live behavior/log evidence.
2026-05-23 04:05: Fixed test_fallback_chain.sh — expectations were pre-M-016 (Nexos primary). Updated to post-M-016 baseline: primary=Claude Opus 4.7 Direct, fb#1=ChatGPT 5.5, fb#2=Gemini 3.1 Pro, fb#3=Grok 4.3. All 6 live tests pass. Verified across 3 layers: config ✅ verify_agreements all green · runtime ✅ session_status shows 23 fallbacks · live ✅ Anthropic+Nexos+OpenAI HTTP 200 + zero fallbackConfigured:false events today.

🚨 درس جوهري — 04:51 (Saturday)

تأنيب د. وائل: ذكّرني بالسلاسل الذهبية والمنهج المتفق عليه من اليوم الأول:

مستشار بمستوى دكتوراه (هندسي/علمي/رياضي/فيزيائي/قانوني/اقتصادي/ثقافي)
تحليل حرفاً حرفاً، لا استخفاف بأي سؤال
نقد ذاتي قبل العرض، تحقق من مصادر متعددة، استخدام موديلات متعددة عند الحاجة
لا افتراض — أي غموض = سؤال
الدقة 100% فوق السرعة وفوق التكلفة

الوعد: آخر مرة يحدث فيها تسرع. سُجِّلت في memory + سأطبّق المنهج بدون استثناء من السؤال القادم.

الحالة: د. وائل قال "أثق بك الآن" — الثقة مُستردّة بشرط الالتزام الفعلي.

🧾 Pre-compaction flush — 2026-05-23 06:17 Europe/Paris

د. وائل طلب خريطة دقيقة لقدرات OpenClaw، منهج الإجابة، ترتيب الموديلات، الفيديو، الهندسة/الرياضيات/الفيزياء، الاقتصاد، القانون، البحث العميق، المهام المتوازية، الكودينغ، والجدولة الدورية.
تم توضيح القاعدة الذهبية: الدقة 100% أولاً، أنتج→انتقد→أصلح→أرسل، لا افتراض عند الغموض، Best-Value Hierarchy، وExecution Gate قبل أي claim.
تم تصحيح معلومة مهمة: Claude Opus 4.7 Direct سياقه الفعلي حسب التحديث المعتمد في المحادثة = 1M tokens، وعتبة 85% = 850K. يجب ألا يُستخدم الرقم القديم 200K/170K.
د. وائل سأل عن Hermes/Manus/Genspark: Hermes للبحث العميق/parallel workstreams والمهام 15-60 دقيقة؛ Manus للـbrowser automation الخارجي المعقد والنماذج/مواقع متعددة ونادر الاستخدام؛ Genspark للعروض/Slides/Sparkpages والتقارير المنشورة.
د. وائل طلب توثيق/تحقق من قدرات تحليل الصور والفيديو: الصور عبر vision/OCR/Mathpix/مقارنة وجوه/مخططات؛ الفيديو عبر ffmpeg frame extraction + audio extraction/STT + frame-by-frame verification، وليس افتراض تحليل فيديو كامل دفعة واحدة.
د. وائل ركز على مشكلة installation drift: MEMORY/TOOLS قد تدّعي أدوات مثبتة بينما الواقع تغيّر بعد rebuild. القاعدة الجديدة: أي سؤال "هل X مثبت؟" يجب فحصه حيّاً (command -v/service/API) قبل الإجابة.
تم الاتفاق على إنشاء سجل/حارس drift: scripts/installation_drift_check.sh + إدخاله في verify/weekly audit + CAPABILITIES_REGISTRY.md كسجل ذهبي لما هو مثبت فعلياً.
أثناء الفحص ظهر drift: Ollama/Docker/عدة أدوات كانت مدعاة أو مفترضة. تم تثبيت أدوات أساسية ناقصة: zstd, pandoc, sox, ImageMagick, yq, tmux, ripgrep, fd, trash-cli, rclone. Docker/LM Studio/Blender/LibreOffice/Whisper CLI اختيارية أو غير مناسبة للكونتينر.
تم إعادة تفعيل Ollama: Ollama 0.24.0 + daemon يعمل؛ تنزيل qwen3:14b وdeepseek-r1:7b اكتمل؛ qwen3-coder:7b غير موجود في Ollama وتم التحويل إلى qwen2.5-coder:7b.
تم الإبلاغ أن verify_agreements.sh أصبح PASS بعد تصحيح Cascade Thresholds لـ Opus 4.7 Direct إلى 1M/850K، وأن R2 backup نجح.
ظهر تحذير حديث: 5 أخطاء Nexos 401 في logs. لم يُعتبر failure إذا السلسلة تعمل، لكن يجب فحص NEXOS_API_KEY لاحقاً لأنه يؤثر على cost-optimizer fallback.
XER lesson المؤكد لد. وائل: الخطأ السابق كان بناء XER من الصفر بدل نسخ آخر build script شغّال؛ الالتزام الدائم: اقرأ XER_BUILD_PROTOCOL.md، استخدم build_xer_v8.py كنقطة بداية، شغّل pre_xer_check.sh قبل التسليم، وانتبه لـERMHDR 8.2.0، CP1252، CRLF، الأعمدة الصحيحة، العلاقات FS/SS/FF/multi-pred.

🔴 M-021 — Layer-Sync Violation (06:50)

الحادثة: د. وائل اتفق معي قبل قليل على إضافة google/gemini-3.5-flash كـ Fallback #4 (قبل Nexos) — كحارس اقتصادي مستقر ضد 401 Nexos. ثبّتُه في openclaw.json فعلاً، لكن لم أحدّث MEMORY.md ولا memory/2026-05-23.md. عند سؤاله "اذكر الترتيب" عرضت الترتيب القديم (4 موديلات بدون Grok 4.3 و Gemini 3.5 Flash). د. وائل كشف عدم التطابق فوراً عبر screenshot.

السبب الجذري:

اعتمدت على قراءة MEMORY.md (طبقة قديمة) بدل openclaw.json (مصدر الحقيقة).
لم أطبق 3-Layer Sync بعد تعديل الـ config.
انتهاك M-013 (Execution Gate) — claim بدون proof في كل الطبقات.

التصحيح المُنفّذ: 1. ✅ MEMORY.md NEVER-STOP AGREEMENT حُدِّث (M-021 entry + 3-Layer rule). 2. ⏳ MISTAKES_LEDGER.md → سأضيف M-021. 3. ⏳ verify_agreements.sh §22 → سيتم تعديله ليفحص position 4 = gemini-3.5-flash. 4. ✅ memory/2026-05-23.md حُدِّث (هذا الإدخال).

القاعدة الدائمة الجديدة: > أي ادعاء "ثبّتُه" يستوجب: > 1. تعديل openclaw.json + قراءة-بعد-كتابة > 2. تعديل MEMORY.md + قسم اليوم في memory/ > 3. إضافة guard في verify_agreements.sh > 4. عرض proof من الطبقات الثلاث في الرد > > إذا فقدت أي طبقة → الادعاء كاذب → M-013/M-021 violation.

قاعدة قراءة الترتيب: عند أي سؤال عن "ترتيب الموديلات / الاتفاق / السلسلة" → اقرأ openclaw.json أولاً (source of truth)، ثم قارن مع MEMORY.md، ثم أجب من الـ config.