أخبار

نظام ذكاء اصطناعي يتفوق على الأطباء في التشخيص الإكلينيكي

نشرت بتاريخ 10 فبراير 2024

وفقًا لباحثين، قد يساعد نظام الذكاء الاصطناعي الجديد هذا في إتاحة خدمات الطب التشخيصي للجميع.

ماريانا لينهرو

أمكن لروبوت دردشة من ابتكار شركة «جوجل» ومن أنظمة نماذج القوالب اللغوية الكبيرة تحصيل بيانات التاريخ الطبي لأشخاص في عمليات محاكاة لمقابلات الفحص الطبي، كما استطاع طرح العديد من التشخيصات المحتملة لهم.
أمكن لروبوت دردشة من ابتكار شركة «جوجل» ومن أنظمة نماذج القوالب اللغوية الكبيرة تحصيل بيانات التاريخ الطبي لأشخاص في عمليات محاكاة لمقابلات الفحص الطبي، كما استطاع طرح العديد من التشخيصات المحتملة لهم.
Credit: Tero Vesalainen/Getty Enlarge image

قدم نظام ذكاء اصطناعي مدرب على إجراء مقابلات الفحص الطبي أداء مضاه للأطباء، بل وتفوق عليهم أحيانًا، في عمليات محاكاة لهذه المقابلات وفي إعداد قائمة بالتشخيصات المرضية المحتملة بناءً على التاريخ الطبي.

فقد أثبت روبوت الدردشة الذي أنتجه نظام الذكاء الاصطناعي ذاك وهو من نماذج القوالب اللغوية الكبيرة التي طورتها شركة «جوجل»، دقة أكبر من أطباء رعاية أولية معتمدين من مجالس طبية في تشخيص عدد من الأمراض التنفسية وأمراض القلب والأوعية الدموية، فضلًا عن أمراض أخرى. ومقارنة بالأطباء البشريين، نجح في استخلاص كم من المعلومات مماثل لما يحصل عليه الأطباء في المقابلات الطبية وحظي بتصنيف أعلى على صعيد تفهم مشاعر المرضى.

تعقيبًا على ذلك، يقول آلان كارثيكسالينجام، العالم المتخصص في الأبحاث الإكلينيكية من شركة «جوجل هيلث»  Google Health في لندن، وهو مؤلف مشارك في هذه الدراسة التي نُشرت في الحادي عشر من يناير الماضي على مستودع المسودات البحثية «آركايف» arXiv، وهي دراسة لم تخضع بعد لمراجعة الأقران: "على حد علمنا، تُعد هذه المرة الأولى التي يُعزز فيها تصميم نظام ذكاء اصطناعي للدردشة بغرض إجراء حوار تشخيصي وتحصيل بيانات التاريخ الطبي".

ولا يزال روبوت الدردشة الذي أُطلق عليه اسم «أرتيكيوليت ميديكال إنتيليجانس إكسبلورر» Articulate Medical Intelligence Explorer، أو اختصارًا «آمي» (AMIE) قيد التجريب. ولم يُختبر أداؤه مع أشخاص يعانون مشكلات صحية حقيقية، وإنما جُرب مع ممثلون مدربون على التعبير عن الحالة الطبية لأشخاص مرضى. من هنا يقول كارثيكسالينجام: "ننشد تفسير نتائجنا بحذر ودون مغالاة".

ورغم أن روبوت الدردشة يفصله شوط طويل عن استخدامه في الرعاية الإكلينيكية، يرى واضعو الدراسة أنه قد يلعب في نهاية المطاف دورًا في إتاحة خدمات الرعاية الطبية التشخيصية للجميع. ومع أنه قد يكون مفيدًا، إلا أنه يجب ألا يغني عن التفاعل مع الأطباء، حسبما يضيف آدام رودمان، اختصاصي طب الأمراض الباطنة من كلية هارفارد للطب في بوسطن بولاية ماساتشوستس الأمريكية، والذي صرح قائلًا في هذا الإطار: "يتجاوز الطب بأشواط كبيرة جمع المعلومات، وهو يرتكز على العلاقات البشرية".

تعلُم المهارات لمهمة حرجة

تقصت بضعة جهود بحثية، سعت إلى تسخير أنظمة نماذج القوالب اللغوية الكبيرة، ما إذا كانت هذه الأنظمة قادرة على محاكاة قدرة الأطباء البشريين على تحصيل بيانات التاريخ الطبي للمرضى، لاستخدامها للوصول إلى تشخيص طبي. وتجدر الإشارة في هذا السياق إلى أن طلاب الطب يمضون وقتًا طويلًا في التدرب على أداء هذه المهمة فحسب، على حد قول رودمان، الذي أضاف أيضًا: "إنها إحدى أهم وأصعب المهارات التي يمكن غرسها في الطبيب".

ووفقًا لفيفيك ناتاراجان، المؤلف المشارك في الدراسة، والعالم المتخصص في أبحاث الذكاء الاصطناعي من شركة «جوجل هيلث» Google Health  في مدينة ماونتن فيو بولاية كاليفورنيا الأمريكية، كان من بين التحديات التي واجهت مطورو روبوت الدردشة نقص المحادثات الواقعية المتاحة من مقابلات الفحص الطبي والتي تُعد لازمة لتدريب هذه الأنظمة على البيانات، وهو ما دعا الباحثون في الدراسة إلى ابتكار طريقة لتدريب روبوت الدردشة على بيانات "محادثات" يجريها هو.

عمد الفريق البحثي بصفة مبدئية إلى إجراء سلسلة من عمليات توليف نظام نماذج القوالب اللغوية الكبيرة، بتدريبه على مجموعات بيانات واقعية متاحة من موارد كالسجلات الإلكترونية الصحية ونصوص المحادثات الطبية. ولصقل مهارة النظام، عكفوا على تحفيزه إلى لعب دور مصابين بحالات مرضية محددة، ولعب دور طبيب إكلينيكي مراع لشعورهم يسعى إلى فهم تواريخهم الطبية للخروج بتشخيص محتمل لهم.

كذلك طلب الفريق البحثي من النظام لعب دور إضافي، ألا وهو دور ناقد يتولى تقييم تفاعُل الطبيب مع المريض المعالج، ويقدم إفادة بالرأي عن كيفية تحسين هذا التفاعل، واستُخدم هذا النقد لتعزيز تدريب نظام الذكاء الاصطناعي واستحداث محادثات مُحسنة.

 ولاختبار أداء النظام، ألحق الفريق البحثي 20 شخصًا بالدراسة، دُربوا على التظاهر بالإصابة بحالات مرضية محددة وطلب منهم خوض محادثات استشارة طبية نصية على الإنترنت، مع نظام «آمي» ومع 20 طبيبًا إكلينيكيًا معتمدًا، دون إطلاعهم على هوية من يحادثونه، سواء كان بشريًا أم روبوت دردشة.

وحاكى الممثلون 149 سيناريو إكلينيكي لحالات مرضية، ثم طُلب منهم تقييم تجربتهم، كما قيم فريق من الخبراء أداء نظام «آمي»، وأداء الأطباء المُعتمدين.

نظام «آمي» يتفوق

قدم نظام الذكاء الاصطناعي أداء مضاهيًا للأطباء أو تفوق عليهم في دقة تشخيص الحالة المرضية في ست تخصصات طبية. كذلك تفوق على الأطباء في 24 معيارًا من جملة 26 معيارًا لجودة المحادثة، من بينها التهذيب، وشرح الحالة المرضية والعلاج والتحلي بالصراحة، والتعبير عن الاهتمام والتفاني.

غير أن كارثيكسالينجام يضيف قائلًا: "لا يعني هذا بأي حال أن نماذج القوالب اللغوية تتفوق على الأطباء في تحصيل معلومات التاريخ الطبي". وينوه إلى أن أطباء الرعاية الأولية الذين شملتهم الدراسة لم يألفوا على الأرجح التفاعل مع المرضى في محادثات بالرسائل النصية، وهو ما يرجح أنه أثَّر في أدائهم.

في المقابل، على حد رأي كارثيكسالينجام، تمتع نظام نماذج القوالب اللغوية المستخدم في الدراسة بمزية، ألا وهي القدرة على صوغ جمل طويلة ببنى لغوية فصيحة في وقت قصير، ما سمح له بأن يبدو على الدوام مراعيًا لشعور المرضى دون أن يظهر عليه تعب أو سأم.

مطلوب: روبوت دردشة لا يعرف الانحياز

من الخطوات المهمة التالية في هذا المبحث إجراء دراسات أكثر تفصيلًا لتقييم احتمالات ارتكاب الروبوت لممارسات انحياز، وضمان توخيه الإنصاف مع مختلف الأطياف البشرية. وقد شرع فريق شركة «جوجل» في دراسة المعايير الأخلاقية المتطلبة لاختبار أداء النظام مع بشر يعانون مشكلات طبية حقيقية.

ويؤيد هذه الخطوة دانيال تينج، العالم المتخصص في الذكاء الاصطناعي الإكلينيكي من كلية ديوك-نوس للطب في سنغافورة، إذ يرى أن دراسة نظام الذكاء الاصطناعي تحسبًا لارتكابه لممارسات تحيز مهم لضمان عدم تجريمه للمجموعات العرقية غير الممثلة بشكل جيد في مجموعة البيانات التي تدرب عليها.

كما أن خصوصية مستخدمي روبوت الدردشة تُعد ملمحًا مهمًا تجب مراعاته، على حد قول تينج، الذي يضيف: "في حال الكثير من نماذج القوالب اللغوية الكبيرة المستخدمة تجاريًا حاليًا، ما زلنا لا نعرف يقينًا أين يُحتفظ ببيانات المستخدمين، وكيف يجري تحليلها".

doi:10.1038/nmiddleeast.2024.46