نحو نماذج الذكاء الاصطناعي التوليدي لفيديوهات العالم الجزيئي
بدءًا من لقطة واحدة في محاكاة، يستخدم نظام جديد الذكاء الاصطناعي التوليدي لمحاكاة ديناميكيات الجزيئات، حيث يربط بين الهياكل الجزيئية الثابتة ويحول الصور الضبابية إلى فيديوهات.
مع تطور قدرات نماذج الذكاء الاصطناعي التوليدي، ربما لاحظت كيف يمكنها تحويل نصوص بسيطة إلى صور فائقة الواقعية وحتى مقاطع فيديو ممتدة.

في الآونة الأخيرة، أظهر الذكاء الاصطناعي التوليدي إمكانات كبيرة في مساعدة الكيميائيين وعلماء الأحياء على استكشاف الجزيئات الثابتة، مثل البروتينات والحمض النووي. يمكن لنماذج مثل “ألفافولد” التنبؤ بالهياكل الجزيئية لتسريع اكتشاف الأدوية، و”RFdiffusion” بمساعدة معهد ماساتشوستس للتكنولوجيا (MIT)، على سبيل المثال، يمكنه تصميم بروتينات جديدة. ومع ذلك، فإن التحدي يكمن في أن الجزيئات تتحرك وتتذبذب باستمرار، وهو أمر بالغ الأهمية عند تصميم بروتينات وأدوية جديدة. محاكاة هذه الحركات على الكمبيوتر باستخدام الفيزياء – وهي تقنية تُعرف باسم “ديناميكيات الجزيئات” – يمكن أن تكون مكلفة للغاية، حيث تتطلب مليارات الخطوات الزمنية على أجهزة الكمبيوتر العملاقة.
كخطوة نحو محاكاة هذه السلوكيات بكفاءة أعلى، طور باحثون من مختبر علوم الكمبيوتر والذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا (CSAIL) وقسم الرياضيات نموذجًا توليديًا يتعلم من البيانات السابقة. يُطلق على نظام الفريق اسم “MDGen”، ويمكنه التقاط لقطة ثلاثية الأبعاد لجزيء ومحاكاة ما سيحدث بعد ذلك مثل الفيديو، أو ربط لقطات ثابتة منفصلة، أو حتى ملء الإطارات المفقودة. من خلال الضغط على “زر التشغيل” للجزيئات، يمكن لهذه الأداة أن تساعد الكيميائيين في تصميم جزيئات جديدة ودراسة كيفية تفاعل نماذج الأدوية الخاصة بهم لأمراض مثل السرطان مع الهياكل الجزيئية المستهدفة.
جدول المحتويات
يقول “بوين جينغ”، المؤلف المشارك الرئيسي للدراسة، إن “MDGen” هو مجرد دليل مبكر على صحة المفهوم، ولكنه يشير إلى بداية اتجاه بحثي جديد ومثير. ويضيف جينغ، طالب الدكتوراه في CSAIL: “في البداية، كانت نماذج الذكاء الاصطناعي التوليدي تنتج فيديوهات بسيطة، مثل شخص يرمش أو كلب يحرك ذيله. ولكن بعد بضع سنوات، أصبح لدينا نماذج مذهلة مثل ‘سورا’ أو ‘فيو’ التي يمكن أن تكون مفيدة بطرق مثيرة للاهتمام. نأمل في غرس رؤية مماثلة للعالم الجزيئي، حيث تكون مسارات الديناميكيات هي الفيديوهات. على سبيل المثال، يمكنك إعطاء النموذج الإطار الأول والعاشر، وسيقوم بتحريك ما بينهما، أو يمكنه إزالة الضوضاء من فيديو جزيئي والتخمين عما كان مخفيًا.”
يؤكد الباحثون أن “MDGen” يمثل تحولًا نموذجيًا عن الأعمال السابقة المشابهة باستخدام الذكاء الاصطناعي التوليدي، حيث يتيح حالات استخدام أوسع بكثير. كانت الأساليب السابقة “تتابعية”، أي أنها اعتمدت على الإطار السابق لبناء الإطار التالي، بدءًا من الإطار الأول لإنشاء تسلسل فيديو. على النقيض من ذلك، يولد “MDGen” الإطارات بشكل متوازٍ باستخدام تقنية الانتشار. وهذا يعني أن “MDGen” يمكن استخدامه، على سبيل المثال، لربط الإطارات عند النقاط النهائية، أو “زيادة معدل الإطارات” في مسار منخفض الإطارات، بالإضافة إلى تشغيل الإطار الأولي.
تم تقديم هذا العمل في ورقة بحثية عرضت في مؤتمر معالجة المعلومات العصبية (NeurIPS) في ديسمبر الماضي. كما حصل على جائزة عن تأثيره التجاري المحتمل في ورشة عمل ML4LMS بالمؤتمر الدولي لتعلم الآلة.
خطوات صغيرة نحو ديناميكيات الجزيئات
في التجارب، وجد جينغ وزملاؤه أن محاكاة “MDGen” كانت مشابهة لتشغيل المحاكاة الفيزيائية مباشرة، بينما أنتجت مسارات أسرع بـ 10 إلى 100 مرة.
اختبر الفريق أولاً قدرة النموذج على التقاط إطار ثلاثي الأبعاد لجزيء وإنشاء الـ 100 نانوثانية التالية. قام النظام بتجميع كتل متتالية مدتها 10 نانوثانية للوصول إلى هذه المدة. ووجد الفريق أن “MDGen” كان قادرًا على منافسة دقة النموذج الأساسي، بينما أكمل عملية إنشاء الفيديو في حوالي دقيقة واحدة – وهي مجرد جزء بسيط من الساعات الثلاث التي استغرقها النموذج الأساسي لمحاكاة نفس الديناميكية.
عندما تم إعطاء “MDGen” الإطار الأول والأخير لتسلسل مدته نانوثانية واحدة، قام أيضًا بنمذجة الخطوات بينهما. أظهر نظام الباحثين درجة من الواقعية في أكثر من 100,000 تنبؤ مختلف: لقد قام بمحاكاة مسارات جزيئية أكثر احتمالًا من النماذج الأساسية في مقاطع الفيديو الأقصر من 100 نانوثانية. في هذه الاختبارات، أظهر “MDGen” أيضًا قدرة على التعميم على الببتيدات التي لم يرها من قبل.
تشمل قدرات “MDGen” أيضًا محاكاة الإطارات داخل الإطارات، و”زيادة معدل الإطارات” بين كل نانوثانية لالتقاط الظواهر الجزيئية الأسرع بشكل أكثر كفاءة. يمكنه حتى “إعادة بناء” هياكل الجزيئات، واستعادة المعلومات المفقودة عنها. يمكن أن تُستخدم هذه الميزات في النهاية من قبل الباحثين لتصميم البروتينات بناءً على كيفية تحرك أجزاء مختلفة من الجزيء.
التلاعب بديناميكيات البروتينات
يقول جينغ والمؤلف المشارك “هانز ستارك” إن “MDGen” هو علامة مبكرة على التقدم نحو توليد ديناميكيات الجزيئات بكفاءة أكبر. ومع ذلك، فإنهم يفتقرون إلى البيانات لجعل هذه النماذج مؤثرة فورًا في تصميم الأدوية أو الجزيئات التي تحفز الحركات التي يرغب الكيميائيون في رؤيتها في الهيكل المستهدف.
يهدف الباحثون إلى توسيع نطاق “MDGen” من نمذجة الجزيئات إلى التنبؤ بكيفية تغير البروتينات بمرور الوقت. يقول ستارك، وهو أيضًا طالب دكتوراه في CSAIL: “حاليًا، نستخدم أنظمة تجريبية. لتعزيز القدرات التنبؤية لـ MDGen في نمذجة البروتينات، سنحتاج إلى البناء على الهيكل الحالي والبيانات المتاحة. ليس لدينا بعد مستودع بحجم ‘يوتيوب’ لهذا النوع من المحاكاة، لذا نأمل في تطوير طريقة تعلم آلي منفصلة يمكنها تسريع عملية جمع البيانات للنموذج.”
في الوقت الحالي، يمثل “MDGen” مسارًا مشجعًا نحو نمذجة التغيرات الجزيئية التي لا تُرى بالعين المجردة. يمكن للكيميائيين أيضًا استخدام هذه المحاكاة للتعمق في سلوك نماذج الأدوية لأمراض مثل السرطان أو السل.
تقول “بوني بيرجر”، أستاذة الرياضيات في معهد ماساتشوستس للتكنولوجيا والباحثة الرئيسية في CSAIL والمؤلفة الرئيسية للورقة البحثية: “تمثل طرق التعلم الآلي التي تتعلم من المحاكاة الفيزيائية حدودًا جديدة في الذكاء الاصطناعي للعلوم. MDGen هو إطار عمل متعدد الأغراض يربط بين هذين المجالين، ونحن متحمسون جدًا لمشاركة نماذجنا المبكرة في هذا الاتجاه.”
ويضيف “تومي جاكولا”، المؤلف الرئيسي المشارك وأستاذ الهندسة الكهربائية وعلوم الكمبيوتر في معهد ماساتشوستس للتكنولوجيا: “إن أخذ عينات من المسارات الواقعية بين الحالات الجزيئية يمثل تحديًا كبيرًا. يظهر هذا العمل المبكر كيف يمكننا البدء في معالجة مثل هذه التحديات من خلال تحويل النمذجة التوليدية إلى عمليات محاكاة كاملة.”
لقد أشاد الباحثون في مجال المعلوماتية الحيوية بهذا النظام لقدرته على محاكاة التحولات الجزيئية. يقول “سيمون أولسون”، الأستاذ المشارك في جامعة تشالمرز للتكنولوجيا، والذي لم يشارك في البحث: “يُعرِّف MDGen محاكاة ديناميكيات الجزيئات كتوزيع مشترك للتضمينات الهيكلية، مما يلتقط الحركات الجزيئية بين الخطوات الزمنية المنفصلة. باستخدام هدف تعلم مقنع، يمكن لـ MDGen تمكين حالات استخدام مبتكرة مثل أخذ عينات من المسارات الانتقالية، مما يشبه إعادة بناء المسارات التي تربط بين المراحل المستقرة.”
تم دعم عمل الباحثين على “MDGen” جزئيًا من قبل المعهد الوطني للعلوم الطبية العامة، ووزارة الطاقة الأمريكية، والمؤسسة الوطنية للعلوم، واتحاد تعلم الآلة لاكتشاف الأدوية وتصنيعها، وعيادة عبد اللطيف جميل لتعلم الآلة في الصحة، ووكالة تقليل التهديدات الدفاعية، ووكالة مشاريع البحوث الدفاعية المتقدمة.