Using AI to control energy for indoor agriculture
30 September 2024
Published online 6 يوليو 2023
التقنية ذاتها التي طورتها شركة «ديب مايند» للعب الشطرنج ولعبة «جو» يمكن أن تساعدنا في كتابة النصوص البرمجية.
Credit: Ed Jones/AFP via Getty
تمكن نظام ذكاء اصطناعي مبنيّ على نظام «ألفا زيرو» AlphaZero الذي طورته شركة «ديب مايند» DeepMind التابعة لشركة جوجل، من ابتكار خوارزميات يمكنها، لدى ترجمتها إلى لغة البرمجة القياسية «سي بلاس بلاس» C++، أن تُرتّب البيانات وتفرزها بسرعة تصل إلى ثلاثة أضعاف سرعة الخوارزميات التي ابتكرها البشر.
تعقيبًا على هذا، يقول دانييل مانكوويتز، اختصاصي علم الحاسوب لدى شركة «ديب مايند» الذي قاد مشروع تطوير هذه الخوارزميات: "صُعقنا بعض الشيء، وفي البداية لم نصدق هذا الاكتشاف".
عكف علماء الحاسوب منذ عقود على تحسين آليات فرز الحواسيب للبيانات كي يختصروا أجزاء من الألف من الثانية عند إخراج نتائج عمليات البحث أو ترتيب قوائم جهات الاتصال ترتيبًا أبجديًّا. ومؤخرًا، نجحت شركة «ديب مايند»، ومقرها لندن، في تحسين سرعات فرز البيانات الحاسوبية بدرجة هائلة عبر استخدام التقنية التي بُني عليها نظامها للذكاء الاصطناعي «ألفا زيرو»، والذي يُستخدم في تطبيقات لُعب الألواح: الشطرنج ولعبتي «جو» و«شوجي»، من أجل المشاركة في لعبة لبناء خوارزميات فرز بيانات. وهو ما علقت عليه إيما برونسكِل، اختصاصية علم الحاسوب من جامعة ستانفورد بولاية كاليفورنيا الأمريكية، معربة عن حماسها قائلة: "إنها نتيجة مشوقة".
وتستعرض ورقة بحثية منشورة في دورية Nature1 نظام فرز البيانات الجديد ذاك، الذي يُسمى «ألفا ديف» AlphaDev، والذي ضُمِّنت بالفعل الخوارزميات الأسرع التي ابتكرها في مكتبتين للغة البرمجة القياسية «سي بلاس بلاس». وقد صار المبرمجون من جميع أنحاء العالم يستخدمونها تريليونات المرات يوميًا.
أول الغيث قطرة
في البداية، استخدم الباحثون نظام «ألفا ديف» في مهمة لفرز الأعداد وفق أحجامها. وبدأوا بداية بسيطة بخوارزميات لا تُرتب سوى ثلاثة، أو أربعة، أو خمسة أعداد فقط في المرة الواحدة، وإن كانت لتلك الخوارزميات أهميتها، إذ إن الخوارزميات التي ترتب القوائم الأكبر تستخدمها. ويعمل نظام «ألفا ديف» على مستوى تعليمات لغة التجميع، وهي تتألف من أكواد برمجية تستحدثها الأدوات الآلية الخاصة بترجمة الأكواد البرمجية التي يكتبها المبرمجون بلغة «سي بلاس بلاس»، وذلك قبل ترجمة هذه اللغة الأخيرة إلى التسلسلات من الصفر والواحد التي تمثل لغة تعليمات الآلة.
ويعمل نظام «ألفا ديف» بأسلوب يشبه سابقه «ألفا زيرو» الذي كان يجمع بين صور من الحوسبة الدارسة والحدسية كي يختار الخطوات التي سيتخذها في ألعاب لوحية2. لكن «ألفا ديف» لا يختار خطوات، وإنما يختار التعليمات التي سيضيفها إلى العملية التي سيجريها (وهو ما يطلق عليه مهندسو «ديب مايند» لعبة لغة التجميع).
فحين يدرس «ألفا زيرو» الاحتمالات عند كل نقطة اتخاذ قرار، فإنه يضع في حسبانه الخطوات المتاحة أمامه، والخطوات الممكنة بعد كل منها، ويتناول كل خطوة بالدراسة على نحو متشعب ليحسب أي الخطوات تجعله أقرب إلى الفوز في نهاية المطاف. غير أن حساب كل الاحتمالات المتشعبة عن كل خطوة ممكنة قد يستغرق زمنًا أطول من عمر الكون، لذا فإنه يستخدم ما يشبه الحدس كي يحد نطاق الاختيارات التي يتناولها بالدراسة. ومع كل خطوة، يُلقِّم البرنامج شبكات عصبية (تشكلها دوال رياضية معقدة قابلة للتوليف) بمعطيات الوضع الحالي في اللعبة، لتبيّن له هذه الشبكات الخطوات الواعدة أكثر من غيرها. وفي أثناء التدريب، فإن البرنامج يُحدِّث باستمرار الشبكات العصبية وفق نتائج اللعبة، كما أنه يستطلع أيضًا الخطوات المحتملة بالعدول أحيانًا عن اختيار الخطوة التي يقيمها النظام على أنها الأقرب إلى النجاح.
مكافأة مجزية
ويمكن لنظام «ألفا ديف» أن يختار من أحد أربعة أنواع من الإجراءات التي تتطلب مقارنة بين قيم، أو إيداع هذه القيم بين مواقع مختلفة من برنامج الفرز الذي يبتكره، أو الانتقال إلى جزء مختلف من البرنامج. وبعد كل خطوة، يحاول النظام ترتيب مجموعة من القوائم، ويتلقى مكافأة وفق عدد عناصر القوائم التي ينجح في ترتيبها ترتيبًا صحيحًا. ثم يواصل اللعب حتى ينتهي من ترتيب جميع القوائم دون أخطاء، أو حتى يصل طول البرنامج إلى حد معين، وبعد ذلك يبدأ برنامجًا جديدًا من الصفر.
وكانت الشبكات العصبية تقيّم برامج عمل النظام وتكافئها، ليس على مدى صواب ترتيبها فقط لعناصر القوائم وإنما على سرعتها في ذلك أيضًا. وقد دَرّب فريق مانكوويتز النظام على تقييم هذه السرعة وفق معيار من اثنين، إجمالي عدد التعليمات أو وقت المعالجة. وكانت أفضل الخوارزميات التي ابتكرها «ألفا ديف» تستغرق وقتًا أسرع بما بين 4% و71% من الوقت الذي تستغرقه خوارزميات البشر، وذلك على حسب المعالج المستخدَم وعدد القيم اللازم ترتيبها. بيد أنه عندما استعين بالخوارزمية عدة مرات لترتيب قوائم بها ربع مليون قيمة، كانت نسبة توفيرها للوقت المستهلك في هذه العملية لا تبلغ سوى قيمة تتراوح ما بين 1 و2%، بسبب أجزاء أخرى لم يحسّنها النظام في كوده البرمجي.
واستخدم فريق «ديب مايند» النظام أيضًا لابتكار خوارزميات أخرى غير خوارزميات الترتيب. فاستغرقت النسخة التي ابتكرها من خوارزمية لتحويل البيانات المخزَّنة بصيغة معينة إلى بِتّات وقتًا أقل بـ67% من الوقت الذي تستغرقه نسخ الخوارزميات المستخدمة عادة لذلك. أما خوارزمية الفهرسة الدالاتية التي ابتكرها، وهي خوارزميات تُستخدم في تخزين البيانات واستردادها، فقد استغرقت وقتًا أقل بـ30% من نظيرتها العادية.
وللوقوف على الكيفية التي ظفر من خلالها النظام بتفوق خوارزمياته، درس الفريق البحثي الخوارزميات عن كثب. وفيما يخص خوارزميات الترتيب، اكتشف الفريق البحثي تكتيكَيْن جديدين استخدمهما النظام، أطلق على أحدهما حركة «ألفا ديف» للإبدال، وعلى الآخر حركة «ألفا ديف» للنسخ. ويشبّههما مانكوويتز بالخطوة رقم 37، وهي خطوة مفاجئة اتخذها نظام «ألفا جو»، وهو نظام سابق لـ«ألفا ديف»، ضد بطل لعبة «جو» البشري لي سيدول في مباراة استعراضية عام 2016 في مدينة سيول الكورية. وعن ذلك يقول مانكوويتز: "بالعودة بالذاكرة إلى هاتين الخطوتين، فقد لعبتا دورًا جوهريًا في الفوز بتلك المباراة، كما أنهما أثرتا في فكرتنا عن الإستراتيجيات".
ومن منظور علمي، فإن مايكل ليتمان، اختصاصي علم الحاسوب من جامعة براون في مدينة بروفيدانس بولاية رود آيلاند الأمريكية، يقول: "لا أظن أن ثمة مستوى عميق من التفكير في هذه العملية"، مشيرًا إلى أن نظام «ألفا زيرو» موجود بالفعل منذ ست سنوات، غير أنه يستدرك قائلًا: "لكن هندسة النظام استثنائية"، مضيفًا أن باحثي «ديب مايند» بارعون في مواءمة تقنياتهم لحل مشكلات جديدة. فقد أجرت الشركة العام الماضي تعديلًا في نظام «ألفا زيرو»، أسفر عن استحداث نظام «ألفا تينسور»3 الذي ابتكر أساليب أسرع لحساب حاصل ضرب مصفوفات من الأرقام.
ويقول مانكوويتز أن فريق «ديب مايند» يتطلع مستقبلًا إلى أن يستخدم خوارزميات على شاكلة خوارزميات «ألفا زيرو» للتصدي لأنواع أخرى من الإشكاليات، بل وأن يستخدمها حتى في تصميم الأجهزة نفسها، فيقول: " نريد في الحقيقة أن نتناول هذه المنظومة كلها بالدراسة".
doi:10.1038/nmiddleeast.2023.94
Stay connected: