
شرکت گوگل دیپمایند (Google DeepMind) با معرفی دو مدل جدید هوش مصنوعی به نامهای Gemini Robotics 1.5 و Gemini Robotics-ER 1.5 تحولی بزرگ در دنیای رباتیک ایجاد کرده است. این دو مدل تازه، نسخهی ارتقاءیافتهی مدل اولیهی Gemini Robotics هستند که پیشتر برای انجام کارهای ساده در محیطهای واقعی طراحی شده بود. در مدلهای جدید، توانایی رباتها فراتر از اجرای دستورات ساده رفته و اکنون میتوانند وظایف چندمرحلهای و پیچیده را با درک عمیقتری از فضا، اشیاء و منطق تصمیمگیری انجام دهند. به گفتهی تیم دیپمایند، هدف از این پیشرفت، نزدیکتر کردن هوش مصنوعی به رفتار طبیعی انسان و ایجاد رباتهایی است که بتوانند در زندگی روزمره بهصورت واقعی و مؤثر کمک کنند.

یکی از آزمایشهای برجسته، موسوم به «آزمایش موز»، نشان میدهد که نسخهی اولیهی Gemini Robotics تنها میتوانست دستوری مانند «موز را در سبد بگذار» را اجرا کند. اما مدل جدید قادر است مجموعهای از میوهها مانند موز، سیب و لیمو را براساس رنگ و نوع در ظروف مجزا مرتب کند. در طول انجام این کار، ربات نهتنها حرکات دقیق و هماهنگی انجام میدهد بلکه به زبان طبیعی توضیح میدهد که چه میکند و چرا این تصمیم را گرفته است. مدل Gemini Robotics-ER 1.5 به عنوان «مغز» سیستم عمل میکند. این مدل نوعی مدل بینایی-زبان (VLM) است که اطلاعات محیطی را تحلیل کرده، دستورات متنی را درک میکند و با استفاده از ابزارهایی مانند Google Search راهحلهای مناسب را پیدا میکند. سپس مدل Gemini Robotics 1.5 که نقش «چشمها و دستها» را دارد، وظیفهی اجرای فیزیکی این دستورها را برعهده میگیرد. این مدل قادر است بر اساس درک تصویری خود از محیط، برنامهریزی انجام دهد، عمل کند و در حین کار بازخوردهای منطقی ارائه دهد.
یکی از ویژگیهای تحسینبرانگیز این مدلها، یادگیری میانسیستمی است. یعنی اگر رباتی مانند Aloha 2 مهارتی جدید یاد بگیرد، آن مهارت میتواند فوراً به رباتهای دیگر مانند Apollo (ربات انساننما) یا Franka (ربات دو بازویی) منتقل شود. این قابلیت نشان میدهد که یادگیری در سیستم Gemini Robotics بهصورت عمومی و قابلانتقال طراحی شده است، نه محدود به یک سختافزار خاص.

در یکی از آزمایشهای پیشرفته، از ربات خواسته شد زبالهها را براساس قوانین بازیافت در شهر سانفرانسیسکو تفکیک کند. ربات با جستوجوی اینترنتی قوانین محلی را پیدا کرده و زبالهها را بهدرستی در دستههای بازیافت، کمپوست و زبالهی معمولی قرار داد. این توانایی، نشانهای از درک عمیق و استدلال مستقل ربات است که پیشتر در مدلهای هوش مصنوعی مشاهده نشده بود.
دیپمایند اعلام کرده است که این فناوری در آینده، پایهای برای توسعهی رباتهای انساننمایی خواهد بود که قادرند کارهای خانگی، صنعتی و خدماتی را با درک موقعیت، تطبیقپذیری بالا و توانایی گفتوگو با انسان انجام دهند. مدلهای جدید Gemini Robotics 1.5 و ER 1.5 را میتوان نقطهی عطفی در مسیر توسعهی رباتهای عمومی دانست؛ رباتهایی که نهتنها میبینند و عمل میکنند، بلکه میفهمند، میاندیشند و تصمیم میگیرند — درست مانند انسان.
منبع خبر: livescience

شاهین آقامعلی


پاسخ :