صدوع في أعماق الأرض تُمزق المدن وتبتلع المنازل وتشرد أعدادًا هائلة من البشر
02 September 2025
نشرت بتاريخ 31 أغسطس 2025
علماء يسعون إلى اكتشاف دور الحمض النووي غير المُرمّز في الجينوم البشري، بمساعدة مجموعة من أدوات الذكاء الاصطناعي.
في عام 1862، ورد أن فيكتور هوجو كتب إلى ناشره سائلًا عن مبيعات روايته «البؤساء» Les Misérables التي كانت قد نشرت حديثًا، وكان استفساره بعلامة واحدة: "؟". وقد جاءت الإجابة أيضًا بعلامة واحدة: "!".
ثمة شكوك تُحيط بهذه القصة التي تحكي عن إحدى أكثر المراسلات إيجازًا في العالم. لكن بعض أنظمة الذكاء الاصطناعي التي تركز على الجينوم قادرة، مثل ناشر الكاتب الفرنسي، على الاستجابة بفاعلية لتعليمات أو مُدخلات قصيرة بالقدر نفسه.
فبدلًا من صوغ الاستفسارات التفصيلية اللازمة لاستخدام روبوت الدردشة ChatGPT بكفاءة، يمكن على سبيل المثال حث نموذج ذكاء اصطناعي، مثل نموذج «إيفو» Evo، المُدرّب على بيانات نحو 300 مليار قاعدة نيوكليوتيدية، منها 80 ألف تسلسل كامل للجينوم الميكروبي، على ابتكار تسلسل جديد من الحمض النووي المتنقل بواسطة الأمر "#". وهو يفعل ذلك بناءً على ما تعلمه عن أنظمة بيولوجية أخرى تعرَّض لها (انظر go.nature.com/3jvp922). فباستخدام أمر مثل "030"، يُمكن لأداة ذكاء اصطناعي تُسمى «ريجل إم» regLM إنتاج تسلسلات من 200 قاعدة نيوكليوتيدية يُتوقع أن تُظهر نشاطًا منظمًا للتعبير الجيني في كل من ثلاثة خطوط خلوية بشرية (go.nature.com/4jpttm8).
ويُعد كلٌّ من «إيفو» و«ريجل إم» جزءًا من مجموعة متنامية سريعًا من الأدوات التي تهدف إلى استيعاب قواعد لغة الجينوم وفكّ تشفيرها وتفسيرها والبناء عليها - لا سيَّما الجزء الأكبر الذي لا يُرمِّز البروتينات. تخيّل نظامًا على غرار «ألفافولد» AlphaFold، يتخصص في فك شفرة الحمض النووي التنظيمي، وهو التسلسلات التي تتحكم في التعبير الجيني.
عندما أطلقت شركة «ديب مايند» DeepMind التابعة لجوجل نظام الذكاء الاصطناعي هذا في عام 2020، زعمت الشركة أنها قدمت حلًا يمكن من خلاله اجتياز "تحدٍّ كبير" استمرّ لعقود في علم الأحياء؛ وهو التنبؤ بالشكل ثلاثي الأبعاد للبروتين من تسلسله وحده. لكن الجزء غير المُرمِّز من الجينوم ربما يُشكّل تحديًا أكبر.
فعادةً ما تُطوى تسلسلات الأحماض الأمينية البروتينية متخذة الأشكال نفسها، مهما كان السياق الخلوي. أما الجينوم، فلا يمكن التنبؤ بسلوكه بالدرجة نفسها، إذ يمكن أن تتناثر أنماط من التسلسلات الجينية الوظيفية القصيرة - من التسلسلات المحفزة أو المعززة للنسخ الجيني ومواقع بدء وتوقف النسخ، وما إلى ذلك - عبر قطاعات طويلة من الحمض النووي تبدو بلا غرض. وربما تتداخل هذه الأنماط من التسلسلات الجينية، أو تتفاعل مع بعضها البعض عبر مسافات طويلة، أو ترتبط بعوامل نسخ بروتينية منافسة، أو تستجيب لإشارات موجودة فقط في خلايا محددة أو في مراحل معينة من التطور. كما أنها توجد مغلفة ومكدسة داخل الكروماتين، وهو مركب من الحمض النووي والبروتين، يمكن تقريبًا لعدد من البروتينات الخارجية الأخرى الوصول إليه اعتمادًا على نشاط الخلية.
فيقول شتاين أرتس، عالم الأحياء الحاسوبية من «مركز في آي بي للذكاء الاصطناعي وعلم الأحياء الحاسوبي» وجامعة لوفين الكاثوليكية في بلجيكا: "إن آليات ترميز البروتينات في الجينوم، والقواعد المنظمة للتعبير عن الجينات في موقع محدد وتوقيت بعينه وبكمية ما تشكل معًا أحد أكثر ألغاز علم الأحياء إثارة للفضول". لكن مع التدريب، تستطيع أدوات الذكاء الاصطناعي اكتشاف الفروق الدقيقة بين التسلسلات الجينية والتنبؤ بوظائفها وسلوكها، والوقوف على أنماط التسلسلات الجينية الأساسية، بل وتقدير أثر تعديلها. ومن هنا، تستطيع نماذج الذكاء الاصطناعي محاولة التنبؤ بالتأثير الفسيولوجي للمتحورات الجينية، فضلًا عن إرشاد تصميم تسلسلات جديدة ذات وظائف محددة.
على أن هذه الأدوات ليست مثالية، ولا يستطيع الباحثون حتى الاتفاق على أمثل طريقة لتقييم أدائها. لكن هذا ما يجعل المجال مثيرًا للاهتمام. في هذا الإطار، تقول جوليا زيتلينجر، عالمة الأحياء النمائية والحاسوبية من معهد ستويرز للأبحاث الطبية في مدينة كنساس سيتي بولاية ميزوري، والتي طورت نموذج ذكاء اصطناعي يُسمى «بي بي نِت» BPNet، تستخدمه لفك ترميز القواعد الميكانيكية الحاكمة للتسلسلات المنظمة للتعبير الجيني: "من الواضح جدًا أنه لغز قابل للحل، لكن كيفية حله تبقى مجهولة".
أمثلة لنماذج ذكاء اصطناعي للتحليل الجينومي
قبل عشر سنوات نشر عالما الأحياء الحاسوبية، جيان تشو وأولجا ترويانسكايا من جامعة برينستون بولاية نيوجيرسي، بيانات أداة «ديب سي» DeepSEA، 1 إحدى أولى أدوات الذكاء الاصطناعي للتحليل الجينومي.
هذه الأداة هي شبكة عصبية تلافيفية (CNN)؛ تتمتع بتصميم أنظمة التعلم العميق نفسها المستخدمة لتعليم أجهزة الكمبيوتر تصنيف الصور، على أنها قطة أو كلب مثلًا. درّب تشو وترويانسكايا أداتهما على بيانات علم الوراثة فوق الجينية، بما في ذلك بيانات عمليات ارتباط عوامل النسخ البروتينية، وإتاحة الكروماتين، والتعديلات التي تطرأ على الهيستونات، من مشروع بحثي عام يُسمى «موسوعة عناصر الحمض النووي» (ENCODE). وتعلّمت الأداة التنبؤ بوجود هذه السمات في 1000 من مقاطع قواعد الحمض النووي النيوكليوتيدية التي لم يسبق لها مصادفتها.
كما أن تدريب الأداة مكنها من تحليل التبعات البيولوجية وخطورة تحورات عدد من التسلسلات الجينية المرتبطة بأمراض بشرية. على سبيل المثال، تبين أن أحد تحورات التسلسلات الجينية المرتبطة بالإصابة بسرطان الثدي، ويُسمى rs4784227، يُعزز على ما يبدو عملية ارتباط الحمض النووي ببروتين يُسمى FOXA1، فيما أن تحورًا يرتبط بالإصابة بحالة الدم المرضية «ألفا ثلاسيميا» α-thalassemia يُنشئ موقع ارتباط مُحتمل للبروتين GATA1، وهو عامل نسخ يلعب دورًا في نمو خلايا الدم.
ومنذ ذلك الحين، شهد هذا المجال تطورًا هائلًا. على سبيل المثال، ديفيد كيلي، الباحث الرئيس في شركة التقنية الحيوية «كاليكو لايف ساينسز» Calico Life Sciences، في جنوب سان فرانسيسكو بولاية كاليفورنيا الأمريكية، أنشأ وشارك في إنشاء نماذج ذكاء اصطناعي متعددة، يحمل العديد منها أسماءً مستوحاة من الكلاب. وتشمل هذه النماذج «أكيتا» Akita 2 (للتنبؤ بالشكل ثلاثي الأبعاد لطيات الجينوم)، ونموذج «باسيت» Basset3، ونموذج «باسينجي» Basenji 4 (للتنبؤ بالتسلسلات المنظِّمة للتعبير الجيني)، ونموذج «بورزوي» Borzoi 5، الذي يتنبأ بالتعبير الجيني على امتداد الجين.
وانبثقت عن هذه النماذج أشكال أخرى منها: فـ«باسيت » أنتج «مالينوي» Malinois، و «بورزوي» أنتج «سكوبي» Scooby. وقد بنى باحثون آخرون نماذجهم الخاصة (بأسماء غير مستوحاة من الكلاب) بما في ذلك نموذج «بفن» Puffin، و «كروم بي بي نِت» ChromBPNet، وغيرهما.
وليست جميع هذه النماذج من الشبكات العصبية التلافيفية. على سبيل المثال، يستخدم كل من نموذج «إنفورمر» Enformer - وهو نموذج يتنبأ بالتعبير الجيني والبيانات فوق الجينية عبر قطاعات طويلة من الحمض النووي - ونموذج «بورزوي»، "مزيجًا من الوحدات البنائية للشبكات العصبية الالتفافية ووحدات بناء المحوِّلات"، حسبما يفيد كيلي، الذي طور مختبره كلا النموذجين. وتُعد الوحدات البنائية للشبكات العصبية التلافيفية رائعة لرصد أنماط التسلسلات الموضعية، ثم تساعد وحدات بناء المحوِّلات (نوع من شبكات تعلم الآلة) في مسح منطقة أكبر من الحمض النووي للنظر في أنماط التسلسل الموضعية من منظور سياقي أوسع قبل التنبؤ بالبيانات". ولكن تصميمات نماذج الذكاء الاصطناعي على اختلافها في هذا الإطار، تأتي في فئتين أو شكلين أساسيين، كما يقول أنشول كونداجي، الباحث في علم الجينوم الحاسوبي من جامعة ستانفورد في كاليفورنيا. يجري تدريب «نماذج التنبؤ بالوظيفة من التسلسل الجيني» Sequence-to-function models الخاضعة للإشراف البشري على البيانات الجينومية الوظيفية - مثل التعبير الجيني أو إتاحة الكروماتين - لتتعلم التنبؤ بوظيفة تسلسلات الحمض النووي التي لم تصادفها من قبل. وغالبًا ما تتمتع هذه النماذج بدقة تنبؤية على مستوى النيوكليوتيد الواحد أو على مستوى مقاطع حمض نووي بطول مقارب، ويمكنها الوقوف على أنماط التسلسلات المهمة، مثل مواقع الارتباط بالبروتينات ذات الأهمية الوظيفية، والتنبؤ بدلالة تغييرها. مثال على هذه النماذج هو نموذج «ديب سي»، ومثال آخر هو نموذج «كروم بي بي نِت»، الذي صممه كونداجي، والذي يتنبأ بمناطق إتاحة الكروماتين.
أما الفئة الأخرى من هذه النماذج، فهي "نماذج اللغة الجينومية" (gLMs) غير الخاضعة للإشراف البشري أو ذاتية الإشراف. وعلى غرار ChatGPT، يمكن تدريبها على كميات هائلة من النصوص - التي تشكلها في هذه الحالة بيانات التسلسل الجينومي - ومهمتها إما التنبؤ بالقاعدة النيوكليوتيدية التالية في التسلسل (أو وحدة "التوكن") أو ملء القواعد المفقودة على أساس السياق المحيط. فتقول أفانتيكا لال، العالمة المتخصصة في تعلم الآلة من شركة «جينينتك» Genentech للتقنية الحيوية بجنوب سان فرانسيسكو، إن هذه النماذج "لا تحاول التنبؤ بنشاط التسلسل، بل تحاول التنبؤ بتركيبه".
كذلك بالتعاون مع العالم المتخصص في تعلم الآلة جوكجن إيراسلان وفريقهما البحثي في «جينينتك»، طورت لال نموذج «ريجل إم»، وهو نموذج لغوي دربه الفريق من خلال وسم التسلسلات المُنظمة للتعبير الجيني بعلامات موجَزة دالة على النشاط الجيني 6 . على سبيل المثال، الوسم "04sequence> >" يشير إلى التعبير الجيني القوي في أحد الخطوط الخلوية وانخفاض النشاط الجيني في خط آخر. ويمكن القول بأن النموذج ليس تمامًا غير خاضع للإشراف البشري، كما يقول إيراسلان، الذي يُطلق عليه اسم نموذج «التنبؤ بالتسلسل من الوظيفة» Function-to-sequence model. ويمكن استخدام هذه الواسمات نفسها لتحفيز «ريجل إم» على استحداث تسلسلات جديدة بسلوكيات متوقعة.
أمكن أيضًا تدريب النموذج «إيفو 2» Evo 2، الذي أُعلن عنه في السابع من فبراير الماضي7، على بيانات 9.3 تريليون زوج من أزواج الحمض النووي القاعدية، تشكل معًا "لمحة على الجينومات تعبر عن جميع التطورات البيولوجية المرصودة فيها"، على حد وصف دراسة أولية ناتجة عن هذه الجهود، نُشرت على موقع «بيو آركايف» bioRxiv. وفي الخطوة التالية، يمكن لهذا النموذج الوقوف على حدود الإنترونات والإكسونات، والتنبؤ بتأثيرات الطفرات، واستحداث تسلسلات جينية وجينومية "واقعية"، من بين أمور أخرى.
أطياف نماذج التحليل الجينومي
يقول كونداجي إنه يمكن أيضًا التمييز بين نماذج الذكاء الاصطناعي الجينومي على أساس نوع التفاعلات المنظمة للتعبير الجيني التي تتنبأ بها. تحدِّد نماذج «التنبؤ الوظيفة من التسلسل الجيني» في الغالب أنماط تسلسلات الحمض النووي المهمة (والتي، نظرًا لاعتماد وظيفتها على قربها من الجين المُنظَّم التعبير عنه، يُقال إنها مُنظمة للتعبير الجيني المجاور) بغض النظر عن نوع العمليات البيولوجية التي تحدث هناك.
على النقيض من ذلك، تهدف « نماذج التنبؤ بالتعبير الجيني في المواقع البعيدة» Trans models إلى تحديد الجينات التي تنظم التعبير عن جينات محددة أخرى وذلك، على سبيل المثال، لتحليل شبكات تنظيم التعبير الجيني. (ويُطلق على هذه النماذج هذا الاسم لأن العوامل التي تتوسط هذا التنظيم تعمل عن بُعد.) لكن مهمتها، كما يقول كونداجي، "لا تزال محفوفة بالعقبات وتواجه الكثير جدًّا من المشكلات"؛ لأن «نماذج التنبؤ بالتعبير الجيني في المواقع البعيدة» - والتي تُدرَّب عادةً على بيانات مثل تعبير الحمض النووي الريبي - يجب أن تستنتج علاقات سببية دون بيانات يمكنها الكشف عن السببية. فلا يوجد ما يضمن أن يكون هناك ارتباط مباشر بين جينين لمجرد أن التعبير عنهما يرتفع وينخفض على نحو متزامن. وحتى لو كان الأمر كذلك، فليس واضحًا بالضرورة في أي اتجاه تسري العلاقة: هل ينظم الجين «أ» الجين «ب» أم العكس؟ وإذا طُلب من هذه النماذج بعد ذلك التنبؤ بتأثير اضطراب أو تغيير ما - كالتنبؤ مثلًا بما يحدث إذا جرى تعطيل جين معين - فغالبًا ما تُخفق.
وهنا، تقول سوشميتا روي، عالمة الأحياء الحاسوبية من جامعة ويسكونسن-ماديسون، إنه يمكن لنماذج الذكاء الاصطناعي أن تتناول كلًا من العناصر التي تنظم، سواء عن قرب أو بعد، التعبير الجيني، وذلك على سبيل المثال، من خلال استحداث بيانات شبكة تنظيم التعبير الجيني بناءً على بيانات إتاحة الكروماتين وترجيح مدى احتمالية تحقق تلك التنبؤات بناءً على التعبير الجيني. وربما يكون « سكوبي»، وهو نموذج يتناول الخلايا المفردة، منبثق عن نموذج «بورزوي» Borzoi، أول نموذج يختصر الفجوة بين كلا نوعي النماذج، كما يقول كونداجي (go.nature.com/3upffnp). فمن خلال الاستفادة من بيانات إتاحة الكروماتين وبيانات عمليات النسخ الجيني للخلية نفسها، يتنبأ بخصائص الجينوم وحالة الخلية في آنٍ واحد. ويضيف كونداجي: "إنه أحد أوائل نماذج التنبؤ بالتعبير الجيني في المواقع القريبة والبعيدة على حد سواء".
ويمكن لنماذج «التنبؤ بالوظيفة من التسلسل الجيني» أيضًا استكشاف جوانب أخرى من تنظيم التعبير الجيني. كمثال، في عام 2024، تمكَّنت فرق بحثية بقيادة تشو (الذي يعمل حاليًا في جامعة جنوب غرب تكساس الطبية في دالاس)، وكونداجي، وتشارلز دانكو، عالم الأحياء الحاسوبية بجامعة كورنيل في إيثاكا، نيويورك، في دراسات منفصلة، من وضع توصيف لنماذج «التنبؤ بالوظيفة من التسلسل الجيني» القادرة على التنبؤ بمواقع بدء النسخ 8–10.
واستخدم تشو نموذج فريقه، بفن، للوقوف على الخصائص الشائعة في عملية التعبير الجيني وموقع العناصر التنظيمية الرئيسية حول مواقع بدء النسخ، بما في ذلك مواقع ارتباط عوامل النسخ YY1 وSP1 وCREB وInitiator. ودرَّب فريق دانكو نموذج الذكاء الاصطناعي الخاص به على بيانات التسلسلات الجينومية وبيانات بدء النسخ لدى كل فرد من مجموعة من 58 فردًا، ما أدى إلى إنشاء مجموعة من النماذج التي، كما يقول، "أدركتْ لأول مرة كيف أن الاختلافات بين الأفراد في تسلسل جينومهم تؤثر في نمط" بدء النسخ.
ويقول تشو إن هذه الدراسات، مجتمعةً، تعد نقطة انطلاق في تحليل أنماط التسلسلات الجينية التي تُنظّم موضع وقوة بدء عملية النسخ، بما في ذلك عملية نسخ عامل النسخ TFIID. يُعد TFIID مُركّبًا بروتينيًا أساسيًا يرتبط بالعنصر المُحفّز للنسخ الجيني المعروف باسم صندوق TATA، وإن كان يبدو أن معظم مُحفّزات النسخ الجيني لدى حقيقيات النوى لا تحتوي على صندوق TATA. ويوضح دانكو ذلك قائلًا: "أحد التفسيرات الميكانيكية لذلك هو أن عامل النسخ TFIID يرتبط بأفضل الخيارات المتاحة من "الخيارات السيئة" عندما يختار موقعًا في مُحفّز نسخ جيني خالٍ من صندوق TATA.
تُعطي معظم النماذج الجينومية هذه التنبؤات من مُدخلات صغيرة نسبيًا عن قواعد نيوكليوتيدية يتراوح عددها ما بين بضعة مئات إلى بضعة آلاف. لكن تنظيم التعبير الجيني يمكن أن يحدث على امتداد قطاعات أطول كثيرًا من الجينوم، وبعض النماذج قادر على إجراء تنبؤات على مستوى هذه الأطوال أو على مستوى أطوال مقاربة. على سبيل المثال، يستوعب نموذج «بورزوي» البيانات المدخلة حول ما يصل إلى 524 ألف زوج قاعدي من الحمض النووي، ويمكن لنموذج «إيفو 2» ونموذج «ألفا جينوم»، AlphaGenome الذي أعلنت عنه حديثًا شركة «ديب مايند» التابعة لجوجل التعامل مع قاعدة بيانات ضخمة.
ويمكن لهذه النماذج ترجمة بيانات هذه التسلسلات إلى مجموعات هائلة من البيانات التقديرية. على سبيل المثال، عند تلقيمه بمدخلات لتسلسلات من 196,608 قاعدة نيوكليوتيدية من الحمض النووي البشري، يُنتج نموذج «إنفورمر 2»131 تنبؤًا لعمليات ارتباط عوامل النسخ، و1860 تنبؤًا للتعديلات التي تطرأ على الهيستونات، و684 تنبؤًا حول إتاحة الكروماتين، و638 تنبؤًا لعمليات التعبير الجيني، بدقةِ تنبؤية على مستوى 128 قاعدة نيوكليوتيدية (go.nature.com/4mbe42h).
الجينوم محدود
مع ذلك، وعلى الرغم من اتساع "مجالات استقبال المدخلات" التي تتسم بها هذه النماذج (أي ما تستوعبه من مدخلات)، فإنها يمكن أن تُغفل بعض التفاصيل، كما يقول جاكوب شرايبر، عالم الأحياء الحاسوبية من معهد أبحاث علم الأمراض الجزيئي في فيينا، لأن التسلسلات المعززة للنسخ الجيني قد تُحدِث تأثيرات ربما تكون ذات دلالة بيولوجية لكن غير مرئية لأداة الذكاء الاصطناعي. ويضيف: "لم ننجح بعد في فك شفرة عمليات تنظيم التعبير الجيني التي تغطي نطاقات بعيدة".
وهناك تحدٍّ آخر يتمثل في أن الجينوم البشري، على اتساعه، محدود؛ فلا يضم سوى عدد يتراوح بين 20 ألفًا و25 ألف جين، على سبيل المثال، ويُنظَّم جزءٌ ضئيلٌ منها فقط بطريقةٍ خاصةٍ على حسب نوع الخلية. هذا يعني أنه فيما يخص كل هذه المليارات من القواعد النيوكليوتيدية، فإن الأمثلة على الاستراتيجيات التنظيمية التي يمكن للنموذج تعلمها قليلةٌ نسبيًا.
حقوق نشر الصورة: Paul Joseph
يقول كارل دي بوير، مهندس الطب الحيوي بجامعة كولومبيا البريطانية في فانكوفر، كندا: "هناك الكثير جدًّا من الآليات الكيميائية الحيوية المختلفة التي يُحتمل حدوثها في الحمض النووي، إلى حد أن عددًا كبيرًا منها ربما لا يطرأ إلا مرة واحدة، أو حتى لا يطرأ على الإطلاق في التسلسل الجينومي البشري".
وإحدى الطرق لتوسيع قاعدة معارف نماذج الذكاء الاصطناعي هي عدم الاكتفاء بتلقيمها ببيانات الجينومات المرجعية. على سبيل المثال، يُدرّب بعض مصممي هذه النماذج أدواتهم على بيانات من عدة أفراد أو من جميع أنحاء شجرة النشوء والتطور لإكساب النماذج فهمًا للتنوع الجيني.
وثمة نهج آخر، طرحه دي بوير وجوسي تايبال، اختصاصي دراسة الأنظمة البيولوجية من جامعة كامبريدج بالمملكة المتحدة، وهو المضي من دراسة الجينومات الطبيعية إلى دراسة الحمض النووي المُخلق بنسبة مائلة بالمائة11.
إبان عمله باحثًا ما بعد الدكتوراه في معهد برود التابع لمعهد ماساتشوستس للتكنولوجيا وجامعة هارفارد في كامبريدج بولاية ماساتشوستس الأمريكية، أجرى دي بوير وفريقه البحثي اختبارات على حوالي 100 مليون تسلسل عشوائي، يبلغ طول كل منها 80 نيوكليوتيدًا )مجموعها يقترب من طول الجينوم البشري(، للتحقق من قدرتها على تحفيز التعبير عن بروتين فلوري في فطر الخميرة Saccharomyces cerevisiae 12 (يتكون جينوم فطر الخميرة من نحو 12 مليون قاعدة نيوكليوتيدية، مقارنة بحوالي 3 مليارات قاعدة نيوكليوتيدية في الجينوم البشري). ويقول دي بوير إن هذا النهج "أفضل كثيرًا" لفهم قواعد لغة الجينوم إذا ما قُورن باستخدام الحمض النووي الجينومي، "لأن جميع الإشارات التي تراها في الحمض النووي العشوائي تنجم عن سبب ما". فإذا رُصد التألق الفلوري، على سبيل المثال، فهذا معناه أن التسلسل نشط. على النقيض من ذلك، فإن الجينوم هو نتاج عملية التطور، مما يعني أن عناصره قد يهيئ تراصها ضغوط التطور الانتقائي وكذلك الوظيفة.
ووفقًا لدي بوير، فقد أسفرت تجربة فطر الخميرة عن رؤيتين كاشفتين رئيسيتين. أولًا، دعمت الدراسة "احتمالية وجود تفاعلات فيزيائية حيوية واسعة النطاق تحدث في مناطق تنظيم التعبير الجيني". فالأنماط الوظيفية من التسلسلات النيوكليوتيدية لم تأخذ ترتيبًا عشوائيًا في التسلسلات النشطة؛ بل تراصت في أشكال محددة؛ على سبيل المثال، لتلائم الفراغات في الشكل الحلزوني للولب الحمض النووي المزدوج.
وأما الرؤية الكاشفة الثانية، فكانت تتعلق بمدى أهمية الدور الذي تلعبه التفاعلات منخفضة الألفة بين عوامل النسخ والحمض النووي. فقد وجد الفريق أنه حتى التفاعلات الضعيفة يمكن أن تؤثر تأثيرًا كبيرًا في تنظيم التعبير الجيني، تمامًا كما يُمكن للتفاعلات الكيميائية الضعيفة نسبيًا أن تُبقي بروتينين معًا.
وإلى جانب دراسة قواعد الجينوم وتنظيم التعبير الجيني، يُمكن للباحثين استخدام نماذج الذكاء الاصطناعي لرسم الخرائط الجينية الدقيقة بهدف معرفة أي المتحورات الجينية البشرية المكتشفة في دراسات الارتباط على نطاق الجينوم (GWAS) تُعد سببًا لنمط ظاهري مُعين. ويذكر هنا أن ما يصل إلى 95% من اختلافات التسلسل الجيني المرصودة في دراسات الارتباط على نطاق الجينوم وُجدت في الحمض النووي غير المُرمِّز13. كذلك يُمكن للباحثين استخدام أدوات التحليل الجينومي القائمة على الذكاء الاصطناعي لسبر الطفرات حاسوبيًا، من أجل فهم تأثير التباين الجيني بشكل أفضل.
ثم أن هناك مقاربة تصميم التسلسلات الجينية. فمن وجهة النظر الهندسية، يُبرهن التصميم الناجح لتسلسل جيني من الصفر على أن الباحثين (أو نماذج الذكاء الاصطناعي الخاصة بهم) قد تعلموا شيئًا جوهريًا عن الجينوم، كما يقول تشو، الذي يضيف: "يمكننا استخدام هذه المقاربة كوسيلة للتحقق من صحة ما وصلنا إليه من مفاهيم". ولتحقيق فائدة عملية أكبر، يمكن استخدام هذه المقاربة أيضًا لإنشاء تسلسلات مواءَمَة تجعل التعبير الجيني ينحصر في وقت وموضع محددين، على سبيل المثال من أجل تطبيقات علاج جيني معينة، أو لتصميم تسلسلات تستجيب لمثيرات محددة. فتقول لال: "أعتقد أن تطبيقات هذه المقاربة فيما يخص العلاج الجيني والعلاج الخلوي واضحة جدًا".
وقد أثبتت عدة أوراق بحثية فاعلية هذا النهج. ففي عام 2024، أفاد كلٌ من آرتس وألكسندر ستارك اختصاصي بيولوجيا النسخ الجيني، من معهد أبحاث البيولوجيا الجزيئية في فيينا، في دراسات منفصلةّ، باستخدامهما لنماذج «التنبؤ بالوظيفة من التسلسل الجيني» كأدوات توقع لاختيار وتطوير تسلسلات جينية ذات سلوك مرغوب فيه في ذباب الفاكهة Drosophila melanogaster 14، 15، وفي حالة آرتس، في الخلايا البشرية أيضًا. واستخدم عالم الوراثة ريان تيوي، من مختبر جاكسون في بار هاربور، بولاية مين الأمريكية، وفريقه البحثي بيانات تجارب على جينات مرشدة لتدريب نموذج مشتق من نموذج «باسيت» Basset، استعان به الفريق بعد ذلك لتصميم تسلسلات نشطة في خلايا الدم والكبد والخلايا العصبية، وكذلك في سمك الزرد والفئران16.
ويشير كونداجي إلى أن هذه الدراسات يغلب عليها استخدام أنواع خلايا شديدة التباين. والتطبيقات العملية، على سبيل المثال في العلاج الجيني، ستتطلب على الأرجح استهداف أنواع محددة من الخلايا في مراحل معينة من التطور، ما يُعد أصعب.
مع ذلك، يمكن للعناصر الجينية التي تسفر النقاب عنها هذه المقاربة أن تكشف عن تفاصيل دقيقة. على سبيل المثال، لاحظ فريق آرتس تداخلًا بين عدد من الرموز التنظيمية 14، ووجد أنه من الممكن تعديل جزء من الحمض النووي التنظيمي بحيث يؤدي ترميز واحد فقط وظيفته. كما اكتشف "تسلسلات شبيهة بالتسلسلات المعززة للنسخ الجيني" يمكن أن تتحول إلى حمض نووي تنظيمي من خلال عدد قليل من الطفرات، وهي ملاحظة تؤكد كيف يمكن لتغيير جيني واحد أن يُنشّط بغير قصد جينات كانت معطلة سابقًا. ويقول حول ذلك: "إن إنشاء تسلسل جديد معزز للنسخ الجيني ليس بالصعب". وقد أظهر الفريق أنه يمكنه تصميم تسلسلات لاستهداف خلايا مختلفة من التسلسل الابتدائي نفسه.
وهذا لا يعني أن نموذج الذكاء الاصطناعي نفسه يُصمّم الحمض النووي. بل إن هذه الإستراتيجيات تميل إلى أخذ تسلسل ابتدائي، واستخدام الذكاء الاصطناعي لاختيار أفضل العناصر أداءً، وتعديل كل قاعدة نيوكليوتيدية حاسوبيًا، ثم تكرار هذه العملية. ولتحسينها، طوّر شرايبر، بالتعاون مع ستارك وعالم الأحياء الحاسوبية ويليام نوبل من جامعة واشنطن في سياتل، خوارزمية تُسمى «لاديدي 17» Ledidi1717. ويوضح شرايبر أنه بدلًا من اختبار أثر كل طفرة محتملة حاسوبيًا، تسعى خوارزمية «لاديدي» إلى إجراء الحد الأدنى من التعديلات الجينية اللازمة لإضفاء السلوك المطلوب.
Credit: Dr. Terra Blevins
ووفقًا لشرايبر، يُمكن لهذه الخوارزمية البرمجية استخدام أدوات تنبؤية عديدة لتحسين عدة عمليات في آنٍ واحد. وكنتيجة، يُمكن استخدام الخوارزمية لتصميم تغييرات جينية بعينها بدقة كبيرة، مثل تقليل إتاحة الكروماتين في منطقة مُحددة دون التأثير في ارتباط بروتين مُحدد بالحمض النووي. كما يُمكن للخوارزمية استحداث مجموعة من الحلول، تشكل ما يُسمى بـ"دليل التآلف الجيني"، لمساعدة الباحثين على دراسة بيولوجيا عملية النسخ الجيني بشكل أفضل.
في المقابل، يتسم نموذجا «إيفو 2» و«ريجل إم» بأنهما من النماذج التوليدية، بمعنى أنهما ينتجان التسلسلات الجديدة من الصفر عند تلقيمهما بمُدخل أو أمر بذلك. في إحدى الدراسات، 18 على سبيل المثال، استخدم اختصاصي الهندسة الكيميائية براين هِي من جامعة ستانفورد وفريقه البحثي أحد إصدارات نموذج «إيفو» لتوليد أزواج بروتينية جديدة من السموم ومضادات السموم، وهي أزواج تستخدمها بعض البكتيريا كوسيلة دفاعية ضد الفيروسات.
كما اختبر آرتس فاعلية نموذج توليدي في دراسته، 14 ووجده فعالًا ولكنه أقل إثارةً للاهتمام فيما يخص فك ترميز عمليات تنظيم التعبير الجيني في المواقع المجاورة. ويوضح أنه باستخدام عملية تصميم تكرارية، من الممكن فحص التسلسلات الجينية بعد كل جولة من التغييرات لاكتساب رؤى كاشفة حول الخصائص البيولوجية للحمض النووي التنظيمي. لنأخذ تجربة شرايبر في استحداث "دليل التآلف الجيني" الذي بناه لعامل النسخ GATA2 مثالًا 17. مع دراسة شرايبر للحلول الجينية المختلفة التي توصل إليها النموذج، وجد أن بعض التسلسلات ذات التعبير الجيني الضعيف نسبيًا تحتوي على عدد أكبر من أنماط التسلسلات الجينية التي ترتبط بعامل النسخ GATA2، فيما افتقرت التسلسلات ذات التعبير الجيني الأقوى إلى مثل هذه الأنماط. ويقول: "تعلم النموذج ترميزًا معقدًا للغاية ينظم التعبير الجيني في الموقع نفسه. وقد تلاعب بتآلف أنماط التسلسل تلك مع عامل النسخ، وبتباعدها النسبي عن بعضها البعض، وبوفرة العناصر المساعدة".
نقاشات محتدمة
يتفق الباحثون على أن نماذج »التنبؤ بالوظيفة من التسلسل الجيني» تعمل بوجه عام كما هو مُعلن. ولكن تبقى طبيعة الأغراض التي يمكن أو ينبغي استخدام هذه النماذج ونماذج الذكاء الاصطناعي الأخرى من أجلها محل نقاش.
في دراستين 19، 20 نُشرتا أواخر عام 2023، أظهرت عالمتا الأحياء الحاسوبية نيلا يوانيديس من جامعة كاليفورنيا، بيركلي، وسارة مصطفوي من جامعة واشنطن في سياتل، وفريقيهما، في دراسات منفصلة، أن نماذج التحليل الجينومي القائمة على الذكاء الاصطناعي تواجه صعوبة في أداء مهمة رئيسة: تفسير سبب اختلاف التباين في التعبير الجيني من شخص لآخر؛ أي لماذا يُعبّر شخص ما عن جين معين أكثر من غيره، بالنظر إلى اختلاف مجموعة المتحورات الجينية من فرد لآخر. في هذا السياق، تقول يوانيديس: "في الواقع، أداء النماذج ضعيف جدًّا في هذه المهمة".
ومما يضفي مزيدًا من التعقيد، أن معايير اختبار فاعلية أداء الذكاء الاصطناعي الحالية لا تُجيب بالضرورة عن الأسئلة التي يرغب الباحثون في طرحها، كما تشير يوانيديس، وخاصةً فيما يتعلق بالتباين الجيني بين الأشخاص. وقد ابتكر فريق كونداجي أداةً خاصة به تُسمى «دارت-إيفال» DART-Eval، للمساعدة في جعل تقييم أداء النماذج أكثر منهجيةً وشمولية. وكذلك فعلت يوانيديس، من خلال أداتها المسماة «جواناين» GUANinE.
وكونداجي أقل انبهارًا من يوانيديس بالنماذج غير الخاضعة للإشراف البشري. فرغم أدائها الجيد مع تسلسلات الترميز والجينومات الصغيرة، فإنه يقول إنه عندما يتعلق الأمر بالحمض النووي التنظيمي للثدييات: "تخفق هذه النماذج إخفاقًا تامًّا".
إذ تتسم النماذج غير الخاضعة للإشراف بجهلها الكبير بالمستويات المتعددة لتنظيم التعبير فوق الجيني، مثل عمليات ارتباط عوامل النسخ وتعديل الهيستونات، التي تُمكّن الجينومات من العمل. فهي لا تدرك ما يحدث عند اضطراب التسلسلات الجينية. وبالطبع، ليست كل قاعدة نيوكليوتيدية في الجينوم ذات معنى. ومع ذلك، يرى مؤيدو الذكاء الاصطناعي في علم الجينوم مستقبلًا واعدًا. فيتوقع كايسي جرين، اختصاصي المعلوماتية الحيوية في الحرم الطبي بجامعة كولورادو أنشوتز في أورورا، يومًا ستتمكن فيه أدوات الذكاء الاصطناعي من تصميم جزء من الحمض النووي مُعدّل بدقة متناهية، تمامًا كما تُولّد التعليمات باللغة الطبيعية ترميزًا اليوم، وهي عملية تُسمى أحيانًا بالترميز البديهي. فيقول: "أريد أن يكون ترميز الجينوم بديهيًا".
ويبقى أن نرى ما إذا كان الذكاء الاصطناعي سيتمكن من فعل ذلك باستخدام مُدخل أو أمر من حرف واحد.
Nature 644, 829-832 (2025)
هذه ترجمة المقال الإنجليزي المنشور في دورية Nature بتاريخ 18 أغسطس عام 2025.
doi:10.1038/nmiddleeast.2025.143
تواصل معنا: