انقلاب دیپ‌مایند در رباتیک با Gemini Robotics 1.5

...

شرکت گوگل دیپ‌مایند (Google DeepMind) با معرفی دو مدل جدید هوش مصنوعی به نام‌های Gemini Robotics 1.5 و Gemini Robotics-ER 1.5 تحولی بزرگ در دنیای رباتیک ایجاد کرده است. این دو مدل تازه، نسخه‌ی ارتقاءیافته‌ی مدل اولیه‌ی Gemini Robotics هستند که پیش‌تر برای انجام کارهای ساده در محیط‌های واقعی طراحی شده بود. در مدل‌های جدید، توانایی ربات‌ها فراتر از اجرای دستورات ساده رفته و اکنون می‌توانند وظایف چندمرحله‌ای و پیچیده را با درک عمیق‌تری از فضا، اشیاء و منطق تصمیم‌گیری انجام دهند. به گفته‌ی تیم دیپ‌مایند، هدف از این پیشرفت، نزدیک‌تر کردن هوش مصنوعی به رفتار طبیعی انسان و ایجاد ربات‌هایی است که بتوانند در زندگی روزمره به‌صورت واقعی و مؤثر کمک کنند.

 

مدل رباتیک گوگل دیپ مایند

 

یکی از آزمایش‌های برجسته، موسوم به «آزمایش موز»، نشان می‌دهد که نسخه‌ی اولیه‌ی Gemini Robotics تنها می‌توانست دستوری مانند «موز را در سبد بگذار» را اجرا کند. اما مدل جدید قادر است مجموعه‌ای از میوه‌ها مانند موز، سیب و لیمو را براساس رنگ و نوع در ظروف مجزا مرتب کند. در طول انجام این کار، ربات نه‌تنها حرکات دقیق و هماهنگی انجام می‌دهد بلکه به زبان طبیعی توضیح می‌دهد که چه می‌کند و چرا این تصمیم را گرفته است. مدل Gemini Robotics-ER 1.5 به عنوان «مغز» سیستم عمل می‌کند. این مدل نوعی مدل بینایی-زبان (VLM) است که اطلاعات محیطی را تحلیل کرده، دستورات متنی را درک می‌کند و با استفاده از ابزارهایی مانند Google Search راه‌حل‌های مناسب را پیدا می‌کند. سپس مدل Gemini Robotics 1.5 که نقش «چشم‌ها و دست‌ها» را دارد، وظیفه‌ی اجرای فیزیکی این دستورها را برعهده می‌گیرد. این مدل قادر است بر اساس درک تصویری خود از محیط، برنامه‌ریزی انجام دهد، عمل کند و در حین کار بازخوردهای منطقی ارائه دهد.

یکی از ویژگی‌های تحسین‌برانگیز این مدل‌ها، یادگیری میان‌سیستمی است. یعنی اگر رباتی مانند Aloha 2 مهارتی جدید یاد بگیرد، آن مهارت می‌تواند فوراً به ربات‌های دیگر مانند Apollo (ربات انسان‌نما) یا Franka (ربات دو بازویی) منتقل شود. این قابلیت نشان می‌دهد که یادگیری در سیستم Gemini Robotics به‌صورت عمومی و قابل‌انتقال طراحی شده است، نه محدود به یک سخت‌افزار خاص.

 

مدل رباتیک گوگل دیپ مایند

 

در یکی از آزمایش‌های پیشرفته، از ربات خواسته شد زباله‌ها را براساس قوانین بازیافت در شهر سان‌فرانسیسکو تفکیک کند. ربات با جست‌وجوی اینترنتی قوانین محلی را پیدا کرده و زباله‌ها را به‌درستی در دسته‌های بازیافت، کمپوست و زباله‌ی معمولی قرار داد. این توانایی، نشانه‌ای از درک عمیق و استدلال مستقل ربات است که پیش‌تر در مدل‌های هوش مصنوعی مشاهده نشده بود.

دیپ‌مایند اعلام کرده است که این فناوری در آینده، پایه‌ای برای توسعه‌ی ربات‌های انسان‌نمایی خواهد بود که قادرند کارهای خانگی، صنعتی و خدماتی را با درک موقعیت، تطبیق‌پذیری بالا و توانایی گفت‌وگو با انسان انجام دهند. مدل‌های جدید Gemini Robotics 1.5 و ER 1.5 را می‌توان نقطه‌ی عطفی در مسیر توسعه‌ی ربات‌های عمومی دانست؛ ربات‌هایی که نه‌تنها می‌بینند و عمل می‌کنند، بلکه می‌فهمند، می‌اندیشند و تصمیم می‌گیرند — درست مانند انسان.

منبع خبر: livescience

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟