منوعات

تصميم الروبوتات المحلية للحصول على بعض المنطق السليم

من مسح الانسكابات إلى تقديم الطعام، تتعلم الروبوتات أداء المهام المنزلية المعقدة بشكل متزايد. ويتعلم العديد من هؤلاء المتدربين الآليين المحليين عن طريق التقليد؛ لقد تمت برمجتهم لنسخ الحركات التي يرشدهم بها الإنسان جسديًا.

اتضح أن الروبوتات مقلدة ممتازة. ولكن ما لم يبرمجها المهندسون أيضًا للتكيف مع كل عثرة أو دفعة محتملة، فإن الروبوتات لا تعرف بالضرورة كيفية التعامل مع هذه المواقف إلا إذا بدأت مهمتها في القمة.

يهدف مهندسو معهد ماساتشوستس للتكنولوجيا الآن إلى منح الروبوتات بعض المنطق السليم عند مواجهة المواقف التي تدفعهم للخروج عن مسار التعلم. لقد طوروا طريقة تربط بيانات حركة الروبوت بـ “المعرفة الفطرية” من نماذج اللغة الكبيرة، أو LLMs.

يسمح نهجهم للروبوت بتحليل العديد من المهام المنزلية بشكل منطقي في المهام الفرعية والتكيف فعليًا مع الاضطرابات داخل مهمة فرعية حتى يتمكن الروبوت من الاستمرار دون الحاجة إلى العودة والبدء من جديد. . يقوم البرنامج بتصحيح كل فشل محتمل على طول الطريق.

يوضح يانوي وانغ، طالب دراسات عليا في قسم الكهرباء بمعهد ماساتشوستس للتكنولوجيا: “يعد التعلم بالتقليد أسلوبًا شائعًا للروبوتات المحلية. ولكن إذا قام الروبوت بتقليد مسارات حركة الإنسان بشكل أعمى، فقد تتراكم الأخطاء الصغيرة وتؤدي في النهاية إلى عرقلة بقية التنفيذ”. هندسة. وتكنولوجيا المعلومات (EECS). “بفضل طريقتنا، يستطيع الروبوت تصحيح أخطاء التنفيذ ذاتيًا وتحسين النجاح العام للمهمة.”

قام وانج وزملاؤه بتفصيل نهجهم الجديد في دراسة سيقدمونها في المؤتمر الدولي لتمثيلات التعلم (ICLR) في شهر مايو. من بين المؤلفين المشاركين في الدراسة طلاب الدراسات العليا في EECS Tsun-Hsuan Wang وJiayuan Mao، ومايكل هاجينو، زميل ما بعد الدكتوراه في قسم الطيران والملاحة الفضائية بمعهد ماساتشوستس للتكنولوجيا (AeroAstro)، وجولي شاه، أستاذ HN Slater في الطيران والملاحة الفضائية في معهد ماساتشوستس للتكنولوجيا.

مهمة لغوية

يوضح الباحثون نهجهم الجديد بمهمة بسيطة: التقاط الكرات الرخامية من وعاء وسكبها في وعاء آخر. ولإنجاز هذه المهمة، يقوم المهندسون عادة بتحريك الروبوت في حركات الجرف والصب، كل ذلك في مسار واحد سلس. ويمكنهم القيام بذلك عدة مرات، لإعطاء الروبوت عددًا من العروض البشرية لتقليدها.

يقول وانغ: “لكن التظاهر البشري هو مسار طويل ومستمر”.

أدرك الفريق أنه على الرغم من قدرة الإنسان على أداء مهمة واحدة دفعة واحدة، إلا أن هذه المهمة تعتمد على سلسلة من المهام الفرعية أو المسارات. على سبيل المثال، يجب أن يصل الروبوت أولاً إلى الوعاء قبل أن يتمكن من غرفه، ويجب عليه التقاط الكرات الرخامية قبل الانتقال إلى الوعاء الفارغ، وهكذا. إذا تم دفع الروبوت أو حثه على ارتكاب خطأ أثناء إحدى هذه المهام الفرعية، فإن ملاذه الوحيد هو التوقف والبدء من البداية، ما لم يقم المهندسون صراحةً بتسمية كل مهمة فرعية وجدولتها أو جمع عروض توضيحية جديدة حتى يتمكن الروبوت من التعافي من الخطأ. هذا الفشل، للسماح للروبوت بتصحيح نفسه في الوقت الحالي.

يقول وانغ: “هذا المستوى من التخطيط ممل للغاية”.

وبدلاً من ذلك، اكتشف هو وزملاؤه أن بعضًا من هذا العمل يمكن إنجازه تلقائيًا بواسطة حاملي شهادة الماجستير في القانون. تقوم نماذج التعلم العميق هذه بمعالجة مكتبات ضخمة من النصوص، والتي تستخدمها لإجراء اتصالات بين الكلمات والجمل والفقرات. باستخدام هذه الاتصالات، يمكن لـ LLM بعد ذلك إنشاء جمل جديدة بناءً على ما تعلمته حول نوع الكلمة التي من المحتمل أن تتبع الكلمة السابقة.

من جانبهم، وجد الباحثون أنه بالإضافة إلى الجمل والفقرات، يمكن أن يُطلب من LLM إنتاج قائمة منطقية من المهام الفرعية التي قد تتضمنها مهمة معينة. على سبيل المثال، إذا طُلب منك سرد الإجراءات المتضمنة في مغرفة الرخام من وعاء إلى آخر، فقد ينتج LLM سلسلة من الأفعال مثل “الوصول” و”التقاط” و”الحمل” و”الصب”.

يقول وانغ: “لدى طلاب ماجستير اللغة طريقة لإخبارك بكيفية القيام بكل خطوة من المهمة، باللغة الطبيعية. إن العرض المستمر للإنسان هو تجسيد لتلك الخطوات، في الفضاء المادي”. “وأردنا ربط الاثنين، حتى يعرف الروبوت تلقائيًا المرحلة التي وصل إليها في المهمة ويكون قادرًا على إعادة الجدولة والتعافي من تلقاء نفسه.”

رسم الخرائط حبة

بالنسبة لنهجهم الجديد، قام الفريق بتطوير خوارزمية لربط تسمية اللغة الطبيعية لـ LLM تلقائيًا لمهمة فرعية معينة بموقع الروبوت في الفضاء المادي أو بصورة تشفر حالة الروبوت. يُعرف رسم الإحداثيات الفيزيائية للروبوت، أو صورة لحالة الروبوت، على تسمية لغة طبيعية باسم “التأريض”. تم تصميم الخوارزمية الجديدة للفريق لتعلم “المصنف”، مما يعني أنها تتعلم التعرف تلقائيًا على المهمة الفرعية الدلالية التي يقوم بها الروبوت – على سبيل المثال، “الوصول” مقابل “السبق الصحفي” – بالنظر إلى إحداثياته ​​المادية أو عرض الصورة. .

“يسهل مصنف التأريض هذا الحوار بين ما يفعله الروبوت في الفضاء المادي وما يعرفه ماجستير إدارة الأعمال عن المهام الفرعية، بالإضافة إلى القيود التي تحتاج إلى الانتباه إليها داخل كل مهمة فرعية”، يوضح وانغ.

أظهر الفريق هذا النهج في التجارب التي أجريت على ذراع آلية قاموا بتدريبها على مهمة جمع الرخام. قام المجربون بتدريب الروبوت من خلال توجيهه جسديًا خلال مهمة الوصول أولاً إلى وعاء، والتقاط الكرات الرخامية، وحملها إلى وعاء فارغ، وسكبها فيه. بعد بعض العروض التوضيحية، استخدم الفريق بعد ذلك ماجستيرًا في القانون مدربًا مسبقًا وطلب من النموذج سرد الخطوات المطلوبة لالتقاط الكرات الرخامية من وعاء إلى آخر. استخدم الباحثون بعد ذلك خوارزميتهم الجديدة لربط المهام الفرعية المحددة لماجستير القانون ببيانات مسار حركة الروبوت. تتعلم الخوارزمية تلقائيًا تعيين الإحداثيات المادية للروبوت في المسارات وعرض الصورة المقابلة لمهمة فرعية معينة.

ثم سمح الفريق للروبوت بأداء مهمة الالتقاط بنفسه، باستخدام مصنفات التأريض التي تم تعلمها حديثًا. ومع تقدم الروبوت خلال مراحل المهمة، قام المجربون بدفع الروبوت ودفعه بعيدًا عن المسار وتسببوا في سقوط الكرات الرخامية من ملعقته في مواقع مختلفة. فبدلاً من التوقف والبدء من البداية، أو الاستمرار بشكل أعمى دون وجود كرات في ملعقته، كان الروبوت قادرًا على التصحيح الذاتي وإكمال كل مهمة فرعية قبل الانتقال إلى المهمة التالية. (على سبيل المثال، كان يتأكد من نجاحه في التقاط الكرات قبل حملها إلى الوعاء الفارغ).

يقول وانغ: “من خلال طريقتنا، عندما يرتكب الروبوت أخطاء، لا نحتاج إلى مطالبة البشر بالبرمجة أو تقديم عروض توضيحية إضافية حول كيفية التعافي من الفشل”. “هذا أمر مثير للغاية لأنه يوجد حاليًا جهد كبير لتدريب الروبوتات المحلية باستخدام البيانات المجمعة على أنظمة التشغيل عن بعد. يمكن لخوارزميتنا الآن تحويل بيانات التدريب هذه إلى سلوك روبوت قوي قادر على أداء المهام المعقدة، على الرغم من الاضطرابات الخارجية.”

..

Source link

orcalimaa

المصدر الرئيسي للأخبار والمعلومات الصحية والطبية الموثوقة وفي الوقت المناسب . توفير معلومات صحية ذات مصداقية ومجتمع داعم وخدمات تعليمية من خلال مزج الخبرة الحائزة على جوائز في المحتوى والخدمات المجتمعية وتعليقات الخبراء والمراجعة الطبية .

مقالات ذات صلة

اترك تعليقاً

زر الذهاب إلى الأعلى