منوعات

الروبوتات العشوائية أكثر موثوقية

قام مهندسو جامعة نورث وسترن بتطوير خوارزمية جديدة للذكاء الاصطناعي (AI) مصممة خصيصًا للروبوتات الذكية. ومن خلال مساعدة الروبوتات على تعلم المهارات المعقدة بسرعة وبشكل موثوق، يمكن للطريقة الجديدة أن تعمل بشكل كبير على تحسين التطبيق العملي – والسلامة – للروبوتات لمجموعة من التطبيقات، بما في ذلك السيارات ذاتية القيادة، وطائرات التوصيل بدون طيار، والمساعدين المنزليين، والأتمتة.

ويكمن نجاح الخوارزمية، التي يطلق عليها أقصى قدر من التعلم المعزز للانتشار (MaxDiff RL)، في قدرتها على تشجيع الروبوتات على استكشاف بيئتها بشكل عشوائي قدر الإمكان من أجل اكتساب مجموعة متنوعة من الخبرات. تعمل هذه “العشوائية المصممة” على تحسين جودة البيانات التي تجمعها الروبوتات حول بيئتها الخاصة. ومن خلال استخدام بيانات عالية الجودة، أظهرت الروبوتات التي تمت محاكاتها تعلمًا أسرع وأكثر كفاءة، مما أدى إلى تحسين موثوقيتها وأدائها بشكل عام.

عند اختبارها مقابل منصات الذكاء الاصطناعي الأخرى، تفوقت الروبوتات التي تمت محاكاتها باستخدام خوارزمية Northwestern الجديدة باستمرار على النماذج الحديثة. في الواقع، تعمل الخوارزمية الجديدة بشكل جيد لدرجة أن الروبوتات تعلمت مهام جديدة ثم قامت بتنفيذها بنجاح في محاولة واحدة، وقامت بذلك بشكل صحيح في المرة الأولى. وهذا يتناقض بشكل صارخ مع نماذج الذكاء الاصطناعي الحالية، والتي تسمح بالتعلم البطيء من خلال التجربة والخطأ.

سيتم نشر البحث يوم الخميس 2 مايو في المجلة ذكاء الآلات الطبيعية.

وقال توماس بيرويتا من جامعة نورث وسترن، الذي قاد الدراسة: “قد تكون أطر الذكاء الاصطناعي الأخرى غير موثوقة إلى حد ما”. “في بعض الأحيان ينجحون تمامًا في مهمة ما، ولكن في أحيان أخرى سيفشلون تمامًا. مع إطار العمل الخاص بنا، طالما أن الروبوت قادر على حل المهمة، في كل مرة تقوم فيها بتشغيل الروبوت الخاص بك، يمكنك أن تتوقع أنه يفعل ما هو بالضبط لقد طُلب منها القيام بذلك، مما يسهل تفسير نجاحات وإخفاقات الروبوتات، وهو أمر بالغ الأهمية في عالم يعتمد بشكل متزايد على الذكاء الاصطناعي.

Berrueta هو مرشح رئاسي في جامعة نورث وسترن وحاصل على دكتوراه. مرشح في الهندسة الميكانيكية في كلية ماكورميك للهندسة. خبير الروبوتات تود مورفي، أستاذ الهندسة الميكانيكية في جامعة ماكورميك ومستشار بيرويتا، هو المؤلف الرئيسي لهذه الورقة. شارك بيرويتا ومورفي في تأليف الورقة مع أليسون بينوسكي، وهي أيضًا حاصلة على درجة الدكتوراه. مرشح في مختبر مورفي.

الانقطاع غير المجسم

لتدريب خوارزميات التعلم الآلي، يستخدم الباحثون والمطورون كميات كبيرة من البيانات الضخمة، التي يقوم البشر بتصفيتها وتنظيمها بعناية. ويتعلم الذكاء الاصطناعي من بيانات التدريب هذه، من خلال التجربة والخطأ حتى يحقق النتائج المثلى. في حين أن هذه العملية تعمل بشكل جيد مع الأنظمة غير المجسدة، مثل ChatGPT وGoogle Gemini (المعروف سابقًا باسم Bard)، إلا أنها لا تعمل مع أنظمة الذكاء الاصطناعي المتجسدة مثل الروبوتات. ومن ناحية أخرى، تقوم الروبوتات بجمع البيانات بنفسها، دون ترف القيمين البشريين.

وقال مورفي: “إن الخوارزميات التقليدية غير متوافقة مع الروبوتات بطريقتين مختلفتين”. “أولاً، يمكن للأنظمة غير المجسدة الاستفادة من عالم لا تنطبق فيه القوانين الفيزيائية. ثانيًا، ليس للفشل الفردي أي عواقب. بالنسبة لتطبيقات الكمبيوتر، الشيء الوحيد المهم هو نجاحها معظم الوقت. وفي مجال الروبوتات، يمكن أن يكون الفشل كارثيًا. “

ولمعالجة هذا الانفصال، سعى بيرويتا ومورفي وبينوسكي إلى تطوير خوارزمية جديدة تضمن قيام الروبوتات بجمع بيانات عالية الجودة أثناء التنقل. في الأساس، يأمر MaxDiff RL الروبوتات بالتحرك بشكل أكثر عشوائية من أجل جمع بيانات شاملة ومتنوعة حول بيئتهم. ومن خلال التعلم من خلال التجارب العشوائية ذاتية التنظيم، تكتسب الروبوتات المهارات اللازمة لأداء مهام مفيدة.

تنجح في المرة الأولى

ولاختبار الخوارزمية الجديدة، قام الباحثون بمقارنتها بالنماذج الحديثة الحالية. وباستخدام المحاكاة الحاسوبية، طلب الباحثون من الروبوتات المحاكية أداء سلسلة من المهام القياسية. بشكل عام، تعلمت الروبوتات التي تستخدم MaxDiff RL بشكل أسرع من النماذج الأخرى. كما أنهم قاموا بأداء المهام بشكل صحيح وأكثر اتساقًا وموثوقية من الآخرين.

ولعل الأمر الأكثر إثارة للإعجاب هو أن الروبوتات التي تستخدم طريقة MaxDiff RL غالبًا ما تمكنت من أداء مهمة بشكل صحيح في محاولة واحدة. وذلك حتى عندما بدأوا بغير علم.

وقال بيرويتا: “كانت الروبوتات لدينا أسرع وأكثر مرونة، وقادرة على تعميم ما تعلمته بشكل فعال وتطبيقه على المواقف الجديدة”. “بالنسبة لتطبيقات العالم الحقيقي، حيث لا تستطيع الروبوتات توفير وقت غير محدود للتجربة والخطأ، فإن هذا يمثل ميزة كبيرة.”

نظرًا لأن MaxDiff RL عبارة عن خوارزمية عامة، فيمكن استخدامها في العديد من التطبيقات. ويأمل الباحثون أن يؤدي هذا إلى حل المشكلات الأساسية التي تعيق هذا المجال، مما يمهد الطريق لاتخاذ قرارات موثوقة في مجال الروبوتات الذكية.

وقال بينوسكي: “ليس من الضروري استخدام هذا فقط للمركبات الآلية التي تتحرك”. “يمكن استخدامه أيضًا للروبوتات الثابتة، مثل الذراع الآلية في المطبخ التي تتعلم كيفية تحميل غسالة الأطباق. ومع ازدياد تعقيد المهام والبيئات المادية، يصبح دور التجسيد أكثر أهمية بحيث يجب أخذه في الاعتبار أثناء عملية التعلم. “هذه خطوة مهمة نحو أنظمة حقيقية قادرة على أداء مهام أكثر تعقيدًا وإثارة للاهتمام. “

تم تمويل الدراسة، التي تحمل عنوان “التعلم الأقصى للانتشار والتعزيز”، من قبل مكتب أبحاث الجيش الأمريكي (رقم المنحة W911NF-19-1-0233) ومكتب الولايات المتحدة للأبحاث البحرية (رقم المنحة N00014-21-1-2706).

..

Source link

orcalimaa

المصدر الرئيسي للأخبار والمعلومات الصحية والطبية الموثوقة وفي الوقت المناسب . توفير معلومات صحية ذات مصداقية ومجتمع داعم وخدمات تعليمية من خلال مزج الخبرة الحائزة على جوائز في المحتوى والخدمات المجتمعية وتعليقات الخبراء والمراجعة الطبية .

مقالات ذات صلة

اترك تعليقاً

زر الذهاب إلى الأعلى