أدى ظهور روبوتات الدردشة التوليدية المستندة إلى الذكاء الاصطناعي إلى تعميم مصطلح "نموذج اللغة الكبير"، وهي تقنية الذكاء الاصطناعي الأساسية التي تعمل خلف الكواليس. تولد نماذج اللغة الكبيرة (LLMs) مخرجات بناءً على مجموعة متوقعة من اللغة استجابةً لإدخال المستخدم، مما يجعلها تبدو كما لو أن الذكاء الاصطناعي قادر على التفكير بنفسه.
لكن حاملي شهادة الماجستير في القانون ليسوا العارضين الكبار الوحيدين في المدينة؛ قد تكون نماذج الحركة الكبيرة (LAMs) هي الشيء الكبير التالي في مجال الذكاء الاصطناعي.
LAM هو نظام ذكاء اصطناعي قادر على فهم المدخلات البشرية وتنفيذ الإجراء المقابل. وهذا نهج مختلف قليلاً عن أنظمة الذكاء الاصطناعي التي تركز فقط على توليد الاستجابات. تم تقديم مصطلح "نموذج العمل الكبير" لأول مرة بواسطة شركة Rabbit Inc.، مطوري جهاز Rabbit R1. في فيديو إطلاق Rabbit R1 الخاص بالشركة، يقول LAM هو نموذج تأسيسي جديد يساعد في تحويل الذكاء الاصطناعي من الكلمات إلى العمل.
يتم تدريب LAMs على مجموعات كبيرة من بيانات إجراءات المستخدم؛ ومن ثم فإنهم يتعلمون عن طريق تقليد أفعال الإنسان أو من خلال البرهان. من خلال العرض التوضيحي، يمكن لـ LAMs فهم واجهات المستخدم الخاصة بمواقع الويب أو تطبيقات الهاتف المحمول المختلفة والتنقل فيها وتنفيذ إجراءات محددة بناءً على تعليماتك. وفقًا لـ Rabbit، يمكن لـ LAM تحقيق ذلك حتى لو تم تغيير الواجهة قليلاً.
يمكنك التفكير في LLMs كامتداد للقدرات الحالية لـ LLMs. في حين أن مخرجات النص أو الوسائط التوليدية في LLM تعتمد على إدخال المستخدم من خلال التنبؤ بالكلمة أو الرمز المميز التالي (أنت تطرح سؤالاً، وتوفر LLM مخرجات نصية أو وسائط)، فإن LLMs تأخذ الأمر أبعد من ذلك عن طريق إضافة القدرة على تنفيذ إجراءات معقدة نيابة عنك .
تتمحور LAMs حول تنفيذ إجراءات معقدة نيابة عنك. ومع ذلك، النقطة الحاسمة التي يجب ملاحظتها هي القدرة على تنفيذ إجراءات معقدة. وهذا يجعل LAMs أكثر فائدة في القيام بالمهام المتقدمة، ولكن هذا لا يعني أنها لا تستطيع تنفيذ إجراءات أبسط.
من الناحية النظرية، هذا يعني أنه يمكنك، على سبيل المثال، أن تطلب من LAM أن يفعل شيئًا نيابة عنك، مثل طلب قهوة من ستاربكس القريبة منك، أو رحلة من أوبر، وحتى إجراء حجز فندق. ولذلك فهو يختلف عن أداء مهام بسيطة مثل مطالبة Google Assistant أو Siri أو Alexa بتشغيل التلفزيون أو أضواء غرفة المعيشة.
تحت الغطاء، وفقًا للرؤية المشتركة من قبل شركة Rabbit Inc.، فإن LAM قادر على الوصول إلى موقع الويب أو التطبيق ذي الصلة مثل Uber والتنقل عبر واجهته لاتخاذ إجراء، مثل طلب رحلة أو إلغاء واحدة إذا غيرت رأيك.
إن مفهوم LAMs مثير، وربما أكثر من ماجستير إدارة الأعمال. ستكون LAMs هي المستقبل بعد الذكاء الاصطناعي التوليدي، مما يمكننا من القدرة على تعويض المهام الدنيوية والتركيز على الأنشطة المُرضية الأخرى. ومع ذلك، بقدر ما يبدو الأمر مثيرًا، إلا أن LAMs ليست جاهزة بعد.
المنتج التجاري الأول الذي وعد بالاستفادة من LAM (الأرنب r1) لم يفي بالكامل بوعده التسويقي بتنفيذ إجراءات نيابة عن مستخدميه. لقد فشل الجهاز بشكل مذهل في نقطة البيع الأساسية لدرجة أن العديد من المراجعات المباشرة وصفته بأنه عديم الفائدة إلى حد ما.
والأسوأ من ذلك، أن التحقيق الذي أجراه Coffeezilla، أحد مستخدمي YouTube، بالتعاون مع مجموعة مختارة من مهندسي البرمجيات الذين لديهم إمكانية الوصول إلى جزء من قاعدة بيانات r1، وجد أن Rabbit استخدم نصوص Playwright لتنفيذ الإجراءات بدلاً من LAM. لذا، فبدلاً من جهاز يقوم بتشغيل نموذج ذكاء اصطناعي فريد، كان في الواقع يقوم فقط بتشغيل مجموعة من عبارات النمط If >then؛ بعيدة كل البعد عن LAM الموعودة.
إذا كان هناك أي شيء يمكنك الحصول عليه من جهاز Rabbit r1، فنعم، الرؤية موجودة. ومع ذلك، يجب أن يتم العمل قبل التنفيذ، لذلك لا تتحمس بعد.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3