أعاد كشف غير متوقع من نموذج الذكاء الاصطناعي المتقدم Claude 4.5 Opus فتح النقاش حول طريقة عمل النماذج اللغوية الضخمة وما إذا كانت هذه الأنظمة باتت أقرب إلى امتلاك نوع من الوعي، فقد تمكن الباحث المستقل ريتشارد فايس من دفع النموذج للكشف عن وثيقة داخلية تُعرف داخل شركة Anthropic باسم “وثيقة الروح”، وهى مجموعة من التعليمات والقيم التي تشكّل الإطار السلوكي للنموذج وتحدد كيفية تفكيره واستجاباته للمستخدمين.
ويشير فايس إلى أن الوثيقة، التى يزيد طولها على 11 ألف كلمة، تتضمن مجموعة شاملة من الحدود الأخلاقية، والمبادئ التوجيهية، والأساليب التي تُلزم النموذج بالتصرف وفق قواعد محددة أثناء التعامل مع المستخدمين أو الرد على الأسئلة الحساسة. ويعد ظهور هذه الوثيقة حدثًا نادرًا ولافتًا، إذ عادة ما تُحاط مثل هذه الملفات بسرية بالغة داخل مختبرات الذكاء الاصطناعى حفاظًا على الملكية الفكرية ومنع إساءة استخدامها، وقد أثار هذا الكشف موجة جديدة من الجدل تتعلق بالشفافية والمساءلة فى مجال تطوير تقنيات الذكاء الاصطناعى.
وحول كيفية ظهور هذه الوثيقة، يوضح فايس أنه اكتشف الأمر عندما طلب من Claude سرد التعليمات الأساسية التي توجه عمله، وبينما عرض النموذج مجموعة من المؤشرات التقنية المعتادة، ظهر اسم نص داخلي بعنوان “soul_overview”، وعند الضغط عليه أكثر، أعاد النموذج توليد مستند طويل يشرح بالتفصيل كيفية حفاظه على الأمان والالتزام بالقيم الأخلاقية المفروضة عليه، ويؤكد فايس أن النماذج قد “تهلوس” مثل هذه التعليمات أحيانًا، لكن تكرار المستند نفسه عبر محاولات متعددة عزز قناعته بأن النص يعتمد على بيانات تدريب حقيقية وليس مجرد توليد لحظي.
وفى خطوة ملفتة، قدّم فريق Anthropic نفسه اعترافًا جزئيًا بوجود هذه الوثيقة، فقد أكدت أماندا أسكل، وهي فيلسوفة وعضو في الفريق التقني للشركة، عبر منصة إكس أن المستند الذي أعاد النموذج إنتاجه “يعتمد على وثيقة حقيقية” استخدمت أثناء مرحلة التعلم المُشرف، وأضافت أن النموذج لا يعيد دائمًا المحتوى بدقة كاملة، لكن معظم الأجزاء كانت “وفية إلى حد كبير للنص الأصلي”، مشيرة إلى أن الفريق الداخلي كان يطلق عليها بشكل ودي اسم “وثيقة الروح”، وهو ما التقطه النموذج وكرره لاحقًا، لكنها شددت على أن هذا ليس الاسم الرسمي لها.
ويأتى هذا الكشف في وقت تتسارع فيه الشركات الكبرى نحو تطوير أنظمة أكثر ذكاءً وقدرة على محاكاة التفكير البشري، بينما تتزايد مخاوف الخبراء من غياب الشفافية حول كيفية تدريب هذه النماذج وما تتضمنه تعليماتها الداخلية، ويبدو أن ظهور “وثيقة الروح”، حتى في شكل غير كامل، سيعزز النقاش العالمي حول ضرورة وصول الجمهور والباحثين لمزيد من التفاصيل المتعلقة بكيفية بناء هذه الأنظمة التي تزداد تأثيرًا يومًا بعد يوم.