اعتمدت اكتشافات علم الأعصاب، بدءًا من طبيعة الذاكرة وحتى علاجات الأمراض، على قراءة أفكار الفئران، لذلك يحتاج الباحثون إلى فهم حقيقي لما يخبرهم به سلوك القوارض أثناء التجارب. في دراسة جديدة تبحث في التعلم من المكافأة، فك باحثون من معهد ماساتشوستس للتكنولوجيا بعض سلوكيات الفئران المحيرة في البداية، مما أدى إلى ظهور أفكار جديدة حول كيفية تفكير الفئران وأداة رياضية لمساعدة الأبحاث المستقبلية.
المهمة التي كان من المفترض أن تتقنها الفئران بسيطة: أدر العجلة إلى اليسار أو اليمين للحصول على مكافأة ثم تعرف عندما يتغير اتجاه المكافأة. عندما يلعب الأشخاص الطبيعيون ألعاب “التعلم العكسي” هذه، فإنهم يستنتجون بسرعة النهج الأمثل: التمسك بالاتجاه الذي يعمل حتى لا ينجح ثم التبديل على الفور. والجدير بالذكر أن الأشخاص المصابين بالفصام يعانون من هذه المهمة. في الدراسة الجديدة في PLOS علم الأحياء الحسابيفاجأت الفئران العلماء عندما أظهرت أنه على الرغم من قدرتها على تعلم استراتيجية «الفوز والبقاء والخسارة في التحول»، إلا أنها رفضت تبنيها بالكامل.
قال المؤلف المقابل مريجانكا سور، أستاذ نيوتن في معهد بيكاور للتعلم والذاكرة وقسم الدماغ والعلوم المعرفية في معهد ماساتشوستس للتكنولوجيا (BCS): “ليس الأمر أن الفئران لا تستطيع تشكيل نموذج قائم على الاستدلال لهذه البيئة، بل يمكنها ذلك”. “الشيء المثير للدهشة هو أنهم لا يصرون على ذلك. حتى في جزء واحد من اللعبة حيث تعلم أن المكافأة هي 100 بالمائة على جانب واحد، فإنهم في كثير من الأحيان سيحاولون الجانب الآخر.”
قال نهات لو، المؤلف الرئيسي وطالب الدراسات العليا في مختبر سور لاب، إنه في حين أن فكرة الابتعاد عن الاستراتيجية المثالية يمكن أن تكون بسبب الفشل في الاحتفاظ بها في الذاكرة، فإن الاحتمال الآخر هو أن الفئران لا تلتزم بمبدأ “الفوز والبقاء والخسارة”. -التحول” لأنهم لا يثقون في أن ظروفهم ستظل مستقرة أو يمكن التنبؤ بها. وبدلا من ذلك، قد ينحرفون عن النظام الأمثل لاختبار ما إذا كانت القواعد قد تغيرت. فالبيئات الطبيعية نادراً ما تكون مستقرة أو يمكن التنبؤ بها.
وقال لو: “أود أن أعتقد أن الفئران أكثر ذكاءً مما ننسب إليهم الفضل فيه”.
ولكن بغض النظر عن السبب الذي قد يدفع الفئران إلى خلط الاستراتيجيات، أضاف المؤلف المشارك الكبير مهرداد جزايري، الأستاذ المشارك في BCS ومعهد ماكجفرن لأبحاث الدماغ، أنه من المهم للباحثين أن يدركوا أنهم يفعلون ذلك وأن يكونوا قادرين على معرفة متى وكيف يختارون استراتيجية أو أخرى.
وقال: “تسلط هذه الدراسة الضوء على حقيقة أنه، على عكس الحكمة المقبولة، فإن الفئران التي تقوم بمهام معملية لا تتبنى بالضرورة استراتيجية ثابتة، وتقدم نهجًا حسابيًا صارمًا لاكتشاف وقياس مثل هذه الحالات غير الثابتة”. “هذه القدرة مهمة لأنه عندما يسجل الباحثون النشاط العصبي، فإن تفسيرهم للخوارزميات والآليات الأساسية قد يكون غير صالح عندما لا يأخذون استراتيجيات التحول لدى الحيوانات في الاعتبار.”
توقع فريق البحث، والذي يضم أيضًا المؤلف المشارك مراد يلدريم، وهو باحث سابق في مرحلة ما بعد الدكتوراه في مختبر سور ويعمل الآن أستاذًا مساعدًا في معهد كليفلاند كلينيك ليرنر للأبحاث، في البداية أن الفئران قد تتبنى استراتيجية أو أخرى. لقد قاموا بمحاكاة النتائج التي كانوا يتوقعون رؤيتها إذا كانت الفئران إما تبنت الإستراتيجية المثلى لاستنتاج قاعدة حول المهمة، أو إجراء مسح عشوائي أكثر حول ما إذا كانت تتم مكافأة المنعطفات إلى اليسار أو اليمين. وتباين سلوك الفأر في المهمة بشكل كبير، حتى بعد أيام، لكنه لم يشبه أبدًا النتائج التي تمت محاكاتها باستخدام استراتيجية واحدة فقط.
وعلى نطاقات فردية مختلفة، عكس أداء الفأرة في المهمة التباين على طول ثلاثة عوامل: مدى سرعة تبديل الاتجاهات بعد تبديل القاعدة، والمدة التي استغرقتها للانتقال إلى الاتجاه الجديد، ومدى ولائها للاتجاه الجديد. عبر 21 فأرًا، مثلت البيانات الأولية تنوعًا مدهشًا في النتائج المتعلقة بمهمة يقوم البشر العاديون بتحسينها بشكل موحد. لكن من الواضح أن الفئران لم تكن عاجزة. تحسن متوسط أدائهم بشكل ملحوظ مع مرور الوقت، على الرغم من أنه استقر دون المستوى الأمثل.
في المهمة، قام الجانب المُكافأ بالتبديل كل 15-25 دورة. أدرك الفريق أن الفئران كانت تستخدم أكثر من استراتيجية واحدة في كل “مجموعة” من اللعبة، بدلاً من مجرد استنتاج القاعدة البسيطة وتحسين الأداء بناءً على هذا الاستدلال. لفك التشابك عندما كانت الفئران تستخدم تلك الإستراتيجية أو أخرى، قام الفريق بتسخير إطار تحليلي يسمى نموذج ماركوف المخفي (HMM)، والذي يمكن أن يستشف حاسوبيًا عندما تنتج حالة غير مرئية نتيجة مقابل حالة أخرى غير مرئية. يشبه Le الأمر بما قد يفعله القاضي في عرض الطبخ: استنتاج أي متسابق من الطهاة قام بإعداد نسخة الطبق بناءً على الأنماط الموجودة في كل طبق من الطعام أمامه.
قبل أن يتمكن الفريق من استخدام HMM لفك تشفير نتائج أداء الماوس، كان عليهم تعديله. قد يتم تطبيق نموذج HMM النموذجي على اختيارات الفأرة الفردية، ولكن هنا قام الفريق بتعديله لشرح انتقالات الاختيار على مدار الكتل الكاملة. أطلقوا على نموذجهم المعدل اسم blockHMM. أظهرت عمليات المحاكاة الحسابية لأداء المهمة باستخدام blockHMM أن الخوارزمية قادرة على استنتاج الحالات المخفية الحقيقية للعامل الاصطناعي. استخدم الباحثون بعد ذلك هذه التقنية لإظهار أن الفئران كانت تمزج باستمرار بين استراتيجيات متعددة، وحققت مستويات متنوعة من الأداء.
وكتب لو وزملاؤه: “لقد تحققنا من أن كل حيوان ينفذ مزيجًا من السلوك من أنظمة متعددة بدلاً من السلوك في مجال واحد”. “في الواقع، استخدمت الفئران 17/21 مجموعة من أنماط السلوك المنخفضة والمتوسطة والعالية الأداء.”
كشف المزيد من التحليل أن الاستراتيجيات الجاري تنفيذها كانت بالفعل استراتيجية استنتاج القاعدة “الصحيحة” واستراتيجية أكثر استكشافية تتوافق مع خيارات الاختبار العشوائي للحصول على تعليقات خطوة بخطوة.
والآن بعد أن قام الباحثون بفك تشفير النهج الغريب الذي تتبعه الفئران في التعلم العكسي، فإنهم يخططون للنظر بشكل أعمق في الدماغ لفهم مناطق ودوائر الدماغ المعنية. ومن خلال مراقبة نشاط خلايا الدماغ أثناء المهمة، يأملون في معرفة السبب وراء القرارات التي تتخذها الفئران لتبديل الاستراتيجيات.