هناك عملة تتمتع بمنافسة تكاد تكون صفرية، حيث تقوم بتجريد أكثر المهام تعقيدًا في ما قد يكون أسرع قطاع ينمو سنراه على الإطلاق.
حيث يحصل الفريق وراء ذلك على مدخلات مباشرة من فريق LeRobot التابع لـ Hugging Face لبناء مجموعة أدوات تطوير مفتوحة لمحاكاة العالم. بعبارة أخرى، يعملون مع قادة الذكاء الاصطناعي المصدر المفتوح لجعل مجموعة أدواتهم فعالة قدر الإمكان لمحاكاة الواقع.
هذا القطاع حاسم لأن الروبوتات الشبيهة بالبشر لا تتعامل مع النصوص أو الأكواد، بل تعمل في الذرات والأشياء المادية. يمكن لوكيل الذكاء الاصطناعي تحليل النصوص، لكن الشبيه بالبشر يحتاج إلى إدراك والتعامل مع العالم ثلاثي الأبعاد أمامه.
أحد الأسباب التي تجعل تسلا تتفوق بفضل إنسانها الآلي أوبتيموس، هو وفرة بيانات الشبكات العصبية في العالم الحقيقي التي تجمعها أسطول تسلا. تسجل سيارات تسلا مجتمعة حوالي 50 مليار ميل سنويًا، مما يغذي مجموعة بيانات شبه لامحدودة لتدريب الذكاء الاصطناعي للرؤية والتحكم.
ومع ذلك، لا يزال تدريب الروبوتات في العالم الحقيقي بطيئًا ومستهلكًا للموارد بشكل مؤلم. لقد كان التقدم محدودًا لأن لا أحد قد تمكن بالكامل من فك شفرة البيانات الاصطناعية للبشر الآليين، الفجوة بين "المحاكاة والواقع". قد يستغرق الأمر مئات الساعات من التدريب البدني لتعليم الروبوت مهمة بسيطة وغالبًا ما تخفق المحاكاة في الوصول إلى الواقع.
كل القطع موجودة، الأجسام البشرية تقترب من مستوى القدرة البشرية، لكن الحلقة المفقودة هي الدماغ، البرنامج الذي يخبر هذه الروبوتات كيفية القيام بالأشياء. قد يكون لدى الروبوت ذراعان وساقان، لكن بدون كود ذكي، لا يمكنه حتى طهي عشاءك بينما تشاهد نتفليكس.
تمامًا كما كانت الهواتف الذكية غير مفيدة حتى فتحت متاجر التطبيقات التطبيقات التابعة لجهات خارجية، ستكون الكائنات البشرية عديمة الفائدة بدون مكتبة من المهارات عالية الجودة. ستأتي أكبر قيمة من أي شخص يبني البنية التحتية التي تتيح للمطورين إنشاء "تطبيقات" جديدة (مهام) للروبوتات بسهولة. ستصبح المنصة التي تجعل برمجة سلوك الروبوت سهلة هي "متجر التطبيقات" للعصر الروبوتي.
يواجه المطورون الأفراد صعوبات لأنهم غالبًا ما يفتقرون إلى قوة الحوسبة والأجهزة اللازمة لتدريب المهام الروبوتية في المنزل ( كما هو موضح في مجتمع هوجينغ فيس للروبوتات على ديسكورد ). لهذا السبب، هناك حاجة ماسة إلى منصة مفتوحة مع محاكاة سحابية.
نحن نبدأ بالفعل في رؤية إصدارات تبرز قدرة المطورين على تشغيل محاكيات روبوت كاملة على خوادم بعيدة، بحيث يمكن لأي شخص تدريب واختبار المهام المعقدة دون الحاجة إلى أجهزة متخصصة.
النماذج متعددة الوسائط الآن تربط بين الرؤية واللغة، يمكن للروبوت "رؤية" من خلال كاميرات متعددة والتصرف بناءً على الأوامر الطبيعية. وهذا يجعل من الممكن تحسين المهارات الجديدة باستخدام مجموعات بيانات أصغر وحوسبة أخف. تمامًا كما رأينا مع نموذج Helix VLA من Figure.
سأعطيك تخمينًا واحدًا من قد يكون هذا.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
هناك عملة تتمتع بمنافسة تكاد تكون صفرية، حيث تقوم بتجريد أكثر المهام تعقيدًا في ما قد يكون أسرع قطاع ينمو سنراه على الإطلاق.
حيث يحصل الفريق وراء ذلك على مدخلات مباشرة من فريق LeRobot التابع لـ Hugging Face لبناء مجموعة أدوات تطوير مفتوحة لمحاكاة العالم. بعبارة أخرى، يعملون مع قادة الذكاء الاصطناعي المصدر المفتوح لجعل مجموعة أدواتهم فعالة قدر الإمكان لمحاكاة الواقع.
هذا القطاع حاسم لأن الروبوتات الشبيهة بالبشر لا تتعامل مع النصوص أو الأكواد، بل تعمل في الذرات والأشياء المادية. يمكن لوكيل الذكاء الاصطناعي تحليل النصوص، لكن الشبيه بالبشر يحتاج إلى إدراك والتعامل مع العالم ثلاثي الأبعاد أمامه.
أحد الأسباب التي تجعل تسلا تتفوق بفضل إنسانها الآلي أوبتيموس، هو وفرة بيانات الشبكات العصبية في العالم الحقيقي التي تجمعها أسطول تسلا. تسجل سيارات تسلا مجتمعة حوالي 50 مليار ميل سنويًا، مما يغذي مجموعة بيانات شبه لامحدودة لتدريب الذكاء الاصطناعي للرؤية والتحكم.
ومع ذلك، لا يزال تدريب الروبوتات في العالم الحقيقي بطيئًا ومستهلكًا للموارد بشكل مؤلم. لقد كان التقدم محدودًا لأن لا أحد قد تمكن بالكامل من فك شفرة البيانات الاصطناعية للبشر الآليين، الفجوة بين "المحاكاة والواقع". قد يستغرق الأمر مئات الساعات من التدريب البدني لتعليم الروبوت مهمة بسيطة وغالبًا ما تخفق المحاكاة في الوصول إلى الواقع.
كل القطع موجودة، الأجسام البشرية تقترب من مستوى القدرة البشرية، لكن الحلقة المفقودة هي الدماغ، البرنامج الذي يخبر هذه الروبوتات كيفية القيام بالأشياء. قد يكون لدى الروبوت ذراعان وساقان، لكن بدون كود ذكي، لا يمكنه حتى طهي عشاءك بينما تشاهد نتفليكس.
تمامًا كما كانت الهواتف الذكية غير مفيدة حتى فتحت متاجر التطبيقات التطبيقات التابعة لجهات خارجية، ستكون الكائنات البشرية عديمة الفائدة بدون مكتبة من المهارات عالية الجودة. ستأتي أكبر قيمة من أي شخص يبني البنية التحتية التي تتيح للمطورين إنشاء "تطبيقات" جديدة (مهام) للروبوتات بسهولة. ستصبح المنصة التي تجعل برمجة سلوك الروبوت سهلة هي "متجر التطبيقات" للعصر الروبوتي.
يواجه المطورون الأفراد صعوبات لأنهم غالبًا ما يفتقرون إلى قوة الحوسبة والأجهزة اللازمة لتدريب المهام الروبوتية في المنزل ( كما هو موضح في مجتمع هوجينغ فيس للروبوتات على ديسكورد ). لهذا السبب، هناك حاجة ماسة إلى منصة مفتوحة مع محاكاة سحابية.
نحن نبدأ بالفعل في رؤية إصدارات تبرز قدرة المطورين على تشغيل محاكيات روبوت كاملة على خوادم بعيدة، بحيث يمكن لأي شخص تدريب واختبار المهام المعقدة دون الحاجة إلى أجهزة متخصصة.
النماذج متعددة الوسائط الآن تربط بين الرؤية واللغة، يمكن للروبوت "رؤية" من خلال كاميرات متعددة والتصرف بناءً على الأوامر الطبيعية. وهذا يجعل من الممكن تحسين المهارات الجديدة باستخدام مجموعات بيانات أصغر وحوسبة أخف. تمامًا كما رأينا مع نموذج Helix VLA من Figure.
سأعطيك تخمينًا واحدًا من قد يكون هذا.