أحدث الأبحاث

الذكاء الاصطناعي يختصر سنوات إلى أيام في مراجعة أدبيات الطب البحثية.. فهل يمكن الوثوق به؟

نشرت بتاريخ 13 يوليو 2025

رغم أن النماذج اللغوية قد تساعد في إسراع وتيرة إنتاج دراسات المراجعة المنهجية، لا يزال يفصل هذه النماذج شوط كبير عن العمل دون إشراف بشري.

هيلين بيرسون

تُلخص دراسات المراجعة المنهجية التي ترشد السياسات نتائج عدة تجارب إكلينيكية ودراسات من نوع آخر.

تُلخص دراسات المراجعة المنهجية التي ترشد السياسات نتائج عدة تجارب إكلينيكية ودراسات من نوع آخر.
. حقوق نشر الصورة: Philippe Lopez/AFP via Getty

أفاد فريق من العلماء أنه استخدم نظام ذكاء اصطناعي لإعادة إنتاج 12 دراسة مراجعة منهجية خلال يومين فقط، ليقلص بذلك الوقت المُستغرق لإنتاج هذه الدراسات عالية الجودة، والتي تغطي نتائج عدة إصدارات بحثية لتخرج عادة إلى النور بعد شهور عديدة.

وهذا النظام الجديد، الذي أوردت مسودة بحثية نُشرت على خادم «ميد آركايف» medRxiv أوصافه الأسبوع الماضي1، قد يساعد، بحسب ما أشار مبتكريه، في إسراع وتيرة إنتاج المراجعات البحثية المؤثرة التي يعول عليها الأطباء وصناع القرار. ووفقًا لكريستيان تساو المؤلف المشارك في الدراسة، وطالب الطب من جامعة تورونتو الكندية، فإن استخدام النماذج اللغوية الكبيرة لإسراع وتيرة مرحلتين مضنيتين من عملية إنتاج دراسات المراجعة المنهجية، سمح للفريق البحثي وراء الدراسة بإعادة إنتاج اثنتي عشرة مراجعة منهجية من مراجعات «كوكرين»، وهو نوع محكم الدقة من الدراسات، بالإضافة إلى أنه أتاح تحديث إحدى هذه المراجعات في غضون 20 دقيقة فقط.

فتعقيبًا على ذلك، يقول تساو: "من المدهش أن أشهد إنجاز دراسة مراجعة منهجية في المدة الزمنية التي أستغرقها لإعداد قدح من القهوة". وقد أسس في تعاوُن بحثي مع باحثَين آخرين شركة منبثقة من هذا الابتكار، باسم «أوتو ريفيو» Otto Review، لترجمة هذه التقنية إلى منصة تجارية برمجية.

غير أن بعض الباحثين يشكك في قدرة التقنية على إسراع وتيرة عملية إنتاج المراجعات المنهجية بحيث تبلغ من السرعة الحد الذي أشار إليه مبتكرو نظام الذكاء الاصطناعي. ويلفتون إلى أن الفريق البحثي وراء الدراسة، لم ينجح حتى هذه اللحظة في أتمتة بعض من أهم مهام هذه العملية، وإلى ضرورة التحقق من فاعلية النظام المبتكر بشكل منفصل، ما يتطلب مزيدًا من التفاصيل عن الدراسة المزمع نشرها. فيقول جيمس توماس، المتخصص في دراسات المراجعة المنهجية من كلية لندن الجامعية: "بما أنها ورقة علمية، لا بد من الجزم بصحة مزاعمها، وهو ما لا يمكنني القيام به".

مهمة تستنزف الوقت

تكتسب دراسات المراجعة المنهجية أهميتها من قدرتها على استيعاب نتائج العديد من الدراسات الأكاديمية مثل التجارب الإكلينيكية، بالجمع بين نتائج هذه الدراسات. كما ترتكز عليها إرشادات مزاولة الطب حول العالم، وتُستخدم بصورة متزايدة في إرشاد السياسات والتعليم وفي مجالات أخرى.

غير أن إنتاج هذه الدراسات مضنٍ، إذ يتطلب البحث في قواعد البيانات الأكاديمية للعثور على دراسات ذات صلة بموضوع المراجعة المنهجية (قد يُقدر عددها بالآلاف) وفحص هذه الدراسات وفرزها لاستخراج أكثرها صلة بمبحث المراجعة المنهجية، وتقييم احتمالية تأثر هذه الدراسات بالانحيازات أو عدم دقتها، واستخراج وتحليل بياناتها، عادةً باستخدام نهج تحليل إحصائي يُعرف بالتحليل التجميعي.  وتستغرق هذه العملية شهورًا، وربما سنوات عديدة، وتجاوِز تكلفتها بحد أدنى 100 ألف دولار أمريكي، وفقًا لأحد التقديرات. ولهذا السبب، لا يواكب عديد من هذه الدراسات أحدث البيانات.

وللسبب نفسه، لطالما استخدم الباحثون البرمجيات لمساعدتهم في إنتاج هذه المراجعات، بيد أن السنوات الأخيرة شهدت اهتمامًا متزايدًا باستخدام الذكاء الاصطناعي لأتمتة أجزاء من هذه المهمة. حول ذلك، يقول جاستن كلارك، الذي يصمم أدوات للمراجعة البحثية المؤتمتة في جامعة بوند في مدينة جولد كوست الأسترالية: "في هذا المجال، تزعم عدة شركات الكثير من المزاعم المغالى فيها".

ابتكر تساو وفريقه البحثي أداتين تعتمدان على النماذج اللغوية الكبيرة بهدف التصدي للخطوتين الأساسيتين في هذه العملية، وهما فرز قائمة طويلة من الدراسات لانتقاء الأوراق البحثية التي ستشملها المراجعة، واستخراج البيانات من هذه الدراسات المنتقاة. ومنهجية الفرز، على سبيل المثال، استخدمت أوامر مُعدة خصيصًا لتوجيه نظام الذكاء الاصطناعي «جي بي تي 4.1» GPT4.1، وهو أحد النماذج اللغوية الكبيرة من شركة «أوبن إيه آي» للتنقيب بين الدراسات وغربلتها. ويفيد الفريق البحثي أن أداتيه هاتين تفوقتا على المراجعين البشريين ذوي الخبرة في هذه المهمة.

وقد اختبر الفريق البحثي فاعلية نظامه، بإعادة إنتاج مجموعة من اثنتي عشرة مراجعة طبية نشرتها عام 2024 منظمة كوكرين، وهي منظمة غير ربحية كائنة في لندن، تشتهر بإنتاج مراجعات بحثية محكمة الدقة تُعد من الأرفع جودة على مستوى العالم. والنسخ المحدثة من هذه المراجعات اختلفت فيها ثلاثة من الاستنتاجات التي كانت مراجعات منظمة كوكرين قد خلصت إليها، لأنها وقفت على أوراق بحثية أُغفلت سابقًا أو نُشرت بعد اكتمال إعداد المراجعات الأصلية. ويرى الفريق البحثي أن تحديث هذه المراجعات الاثنتي عشرة من دون الذكاء الاصطناعي كان سيستغرق من شخص واحد 12 عامًا، وليس يومين.

عملية مستمرة

ولَّدت مسودة هذه الدراسة ضجة وحماسًا في أوساط المتخصصين في المراجعات المنهجية عند نشرها الأسبوع الماضي. غير أن حماس كلارك لها فتر، على حد قوله، عندما محَّص الدراسة ليكتشف أن النظام المبتكر "لا ينجز إلا اثنتين من كبرى مهام المراجعة". فهو لا يضع تصميم دراسة المراجعة المنهجية أو يبحث عن دراسات أخرى ويمحصها تحسبًا لتأثرها بالانحيازات، أو يحلل بياناتها أو يصوغ نتائجها، الأمر الذي قد يكون شاقًا ويستنزف الوقت. وعلى حد قوله، فإن التطورات التقنية ستتيح على الأرجح خلال عامين أتمتة إضافة دراسات للمراجعات المنهجية القائمة، لكن ابتكار نظام مؤتمت تمامًا قادر على استحداث مراجعة منهجية من الصفر سيستغرق وقتًا أطول.

ويقر تساو بأن سير العمل الذي وضعه فريقه للمراجعة المنهجية غير مكتمل، ويعلل لذلك بأنه أراد مع فريقه "الإبقاء على مشاركة البشر" في بعض خطوات هذه العملية. وأضاف أنه يعمل مع فريقه في الوقت الحالي على أتمتة المزيد من المهام. وحسبما أوضح، فإن هدف شركته على المدى الطويل هو إعادة إنتاج أي مراجعة منهجية نُشرت وتحديثها باستمرار، لتتحول إلى "عملية مراجعة مستمرة".

أما توماس، فيشارك مع منظمة كوكرين وفرق بحثية أخرى في مساعٍ لوضع توجيهات حول الاستخدام المسؤول لأنظمة الذكاء الاصطناعي في تخليق الأدلة  — من بينها توجيهات حول كيفية اختبار أداء هذه الأنظمة بدقة. فيقول: "ستظهر أدوات ذكاء اصطناعي للاستخدام من كل حدب وصوب. والمشكلة الحقيقية هي أن تبني هذه التقنيات والأدوات يسبق ظهور الأدلة" التي تثبت فاعليتها. 

هذه ترجمة المقال الإنجليزي المنشور في دورية Nature بتاريخ 19 يونيو عام 2025.

doi:10.1038/nmiddleeast.2025.107