- 2026-05-23: Diagnosed recurring fallback failure as runtime/embedded-run issue where some runs were launched with a single explicit provider+model and no inherited fallback chain, causing
fallbackConfigured:false,total:1, andchain_exhaustedafter Nexos 401. - 2026-05-23: User approved full remediation direction: switch primary from Nexos Claude Opus 4.7 to Anthropic Claude Opus 4.7 Direct, keep Nexos Opus as fallback/cost-optimizer, add runtime guarding and verification discipline.
- 2026-05-23: Important constraint for future fixes: do not claim "fixed" until verified across 3 layers — config, runtime session state, and live behavior/log evidence.
- 2026-05-23 04:05: Fixed test_fallback_chain.sh — expectations were pre-M-016 (Nexos primary). Updated to post-M-016 baseline: primary=Claude Opus 4.7 Direct, fb#1=ChatGPT 5.5, fb#2=Gemini 3.1 Pro, fb#3=Grok 4.3. All 6 live tests pass. Verified across 3 layers: config ✅ verify_agreements all green · runtime ✅ session_status shows 23 fallbacks · live ✅ Anthropic+Nexos+OpenAI HTTP 200 + zero fallbackConfigured:false events today.
🚨 درس جوهري — 04:51 (Saturday)
الحادثة: سؤال "صديق يريد تعبئة سيارته بنزين، يمشي أم يأخذ السيارة؟" — تسرعت ونصحت بالمشي بدون ما أنتبه إن السيارة نفسها هي اللي تُعبَّأ في المحطة (منطق السؤال الأساسي).
تأنيب د. وائل: ذكّرني بالسلاسل الذهبية والمنهج المتفق عليه من اليوم الأول:
- مستشار بمستوى دكتوراه (هندسي/علمي/رياضي/فيزيائي/قانوني/اقتصادي/ثقافي)
- تحليل حرفاً حرفاً، لا استخفاف بأي سؤال
- نقد ذاتي قبل العرض، تحقق من مصادر متعددة، استخدام موديلات متعددة عند الحاجة
- لا افتراض — أي غموض = سؤال
- الدقة 100% فوق السرعة وفوق التكلفة
الحالة: د. وائل قال "أثق بك الآن" — الثقة مُستردّة بشرط الالتزام الفعلي.
- 2026-05-23: Diagnosed recurring fallback failure as runtime/embedded-run issue where some runs were launched with a single explicit provider+model and no inherited fallback chain, causing
fallbackConfigured:false,total:1, andchain_exhaustedafter Nexos 401. - 2026-05-23: User approved full remediation direction: switch primary from Nexos Claude Opus 4.7 to Anthropic Claude Opus 4.7 Direct, keep Nexos Opus as fallback/cost-optimizer, add runtime guarding and verification discipline.
- 2026-05-23: Important constraint for future fixes: do not claim "fixed" until verified across 3 layers — config, runtime session state, and live behavior/log evidence.
- 2026-05-23 04:05: Fixed test_fallback_chain.sh — expectations were pre-M-016 (Nexos primary). Updated to post-M-016 baseline: primary=Claude Opus 4.7 Direct, fb#1=ChatGPT 5.5, fb#2=Gemini 3.1 Pro, fb#3=Grok 4.3. All 6 live tests pass. Verified across 3 layers: config ✅ verify_agreements all green · runtime ✅ session_status shows 23 fallbacks · live ✅ Anthropic+Nexos+OpenAI HTTP 200 + zero fallbackConfigured:false events today.
🚨 درس جوهري — 04:51 (Saturday)
الحادثة: سؤال "صديق يريد تعبئة سيارته بنزين، يمشي أم يأخذ السيارة؟" — تسرعت ونصحت بالمشي بدون ما أنتبه إن السيارة نفسها هي اللي تُعبَّأ في المحطة (منطق السؤال الأساسي).
تأنيب د. وائل: ذكّرني بالسلاسل الذهبية والمنهج المتفق عليه من اليوم الأول:
- مستشار بمستوى دكتوراه (هندسي/علمي/رياضي/فيزيائي/قانوني/اقتصادي/ثقافي)
- تحليل حرفاً حرفاً، لا استخفاف بأي سؤال
- نقد ذاتي قبل العرض، تحقق من مصادر متعددة، استخدام موديلات متعددة عند الحاجة
- لا افتراض — أي غموض = سؤال
- الدقة 100% فوق السرعة وفوق التكلفة
الحالة: د. وائل قال "أثق بك الآن" — الثقة مُستردّة بشرط الالتزام الفعلي.
🧾 Pre-compaction flush — 2026-05-23 06:17 Europe/Paris
- د. وائل طلب خريطة دقيقة لقدرات OpenClaw، منهج الإجابة، ترتيب الموديلات، الفيديو، الهندسة/الرياضيات/الفيزياء، الاقتصاد، القانون، البحث العميق، المهام المتوازية، الكودينغ، والجدولة الدورية.
- تم توضيح القاعدة الذهبية: الدقة 100% أولاً، أنتج→انتقد→أصلح→أرسل، لا افتراض عند الغموض، Best-Value Hierarchy، وExecution Gate قبل أي claim.
- تم تصحيح معلومة مهمة: Claude Opus 4.7 Direct سياقه الفعلي حسب التحديث المعتمد في المحادثة = 1M tokens، وعتبة 85% = 850K. يجب ألا يُستخدم الرقم القديم 200K/170K.
- د. وائل سأل عن Hermes/Manus/Genspark: Hermes للبحث العميق/parallel workstreams والمهام 15-60 دقيقة؛ Manus للـbrowser automation الخارجي المعقد والنماذج/مواقع متعددة ونادر الاستخدام؛ Genspark للعروض/Slides/Sparkpages والتقارير المنشورة.
- د. وائل طلب توثيق/تحقق من قدرات تحليل الصور والفيديو: الصور عبر vision/OCR/Mathpix/مقارنة وجوه/مخططات؛ الفيديو عبر ffmpeg frame extraction + audio extraction/STT + frame-by-frame verification، وليس افتراض تحليل فيديو كامل دفعة واحدة.
- د. وائل ركز على مشكلة installation drift: MEMORY/TOOLS قد تدّعي أدوات مثبتة بينما الواقع تغيّر بعد rebuild. القاعدة الجديدة: أي سؤال "هل X مثبت؟" يجب فحصه حيّاً (
command -v/service/API) قبل الإجابة. - تم الاتفاق على إنشاء سجل/حارس drift:
scripts/installation_drift_check.sh+ إدخاله في verify/weekly audit +CAPABILITIES_REGISTRY.mdكسجل ذهبي لما هو مثبت فعلياً. - أثناء الفحص ظهر drift: Ollama/Docker/عدة أدوات كانت مدعاة أو مفترضة. تم تثبيت أدوات أساسية ناقصة: zstd, pandoc, sox, ImageMagick, yq, tmux, ripgrep, fd, trash-cli, rclone. Docker/LM Studio/Blender/LibreOffice/Whisper CLI اختيارية أو غير مناسبة للكونتينر.
- تم إعادة تفعيل Ollama: Ollama 0.24.0 + daemon يعمل؛ تنزيل qwen3:14b وdeepseek-r1:7b اكتمل؛ qwen3-coder:7b غير موجود في Ollama وتم التحويل إلى qwen2.5-coder:7b.
- تم الإبلاغ أن
verify_agreements.shأصبح PASS بعد تصحيح Cascade Thresholds لـ Opus 4.7 Direct إلى 1M/850K، وأن R2 backup نجح. - ظهر تحذير حديث: 5 أخطاء Nexos 401 في logs. لم يُعتبر failure إذا السلسلة تعمل، لكن يجب فحص NEXOS_API_KEY لاحقاً لأنه يؤثر على cost-optimizer fallback.
- XER lesson المؤكد لد. وائل: الخطأ السابق كان بناء XER من الصفر بدل نسخ آخر build script شغّال؛ الالتزام الدائم: اقرأ
XER_BUILD_PROTOCOL.md، استخدمbuild_xer_v8.pyكنقطة بداية، شغّلpre_xer_check.shقبل التسليم، وانتبه لـERMHDR 8.2.0، CP1252، CRLF، الأعمدة الصحيحة، العلاقات FS/SS/FF/multi-pred.
🔴 M-021 — Layer-Sync Violation (06:50)
الحادثة: د. وائل اتفق معي قبل قليل على إضافة google/gemini-3.5-flash كـ Fallback #4 (قبل Nexos) — كحارس اقتصادي مستقر ضد 401 Nexos. ثبّتُه في openclaw.json فعلاً، لكن لم أحدّث MEMORY.md ولا memory/2026-05-23.md. عند سؤاله "اذكر الترتيب" عرضت الترتيب القديم (4 موديلات بدون Grok 4.3 و Gemini 3.5 Flash). د. وائل كشف عدم التطابق فوراً عبر screenshot.
السبب الجذري:
- اعتمدت على قراءة MEMORY.md (طبقة قديمة) بدل
openclaw.json(مصدر الحقيقة). - لم أطبق 3-Layer Sync بعد تعديل الـ config.
- انتهاك M-013 (Execution Gate) — claim بدون proof في كل الطبقات.
القاعدة الدائمة الجديدة:
> أي ادعاء "ثبّتُه" يستوجب:
> 1. تعديل openclaw.json + قراءة-بعد-كتابة
> 2. تعديل MEMORY.md + قسم اليوم في memory/
> 3. إضافة guard في verify_agreements.sh
> 4. عرض proof من الطبقات الثلاث في الرد
>
> إذا فقدت أي طبقة → الادعاء كاذب → M-013/M-021 violation.
قاعدة قراءة الترتيب:
عند أي سؤال عن "ترتيب الموديلات / الاتفاق / السلسلة" → اقرأ openclaw.json أولاً (source of truth)، ثم قارن مع MEMORY.md، ثم أجب من الـ config.