قال الرئيس التنفيذي لشركة جوجل، سوندار بيتشاي، إن التطورات الجديدة في الوسائط المتعددة – مثل إخراج الصور والصوت الأصلي – واستخدام الأدوات الأصلية ستمكن عملاق التكنولوجيا من بناء وكلاء الذكاء الاصطناعي الذين يقربونهم من رؤيتهم لمساعد عالمي
يمكن لبرنامج Gemini 2.0 إنشاء الصور والمقاطع الصوتية جنبًا إلى جنب مع النص. كما يمكنه أيضًا استخدام أدوات مثل Google Search وMaps.
كشفت شركة جوجل يوم 11 ديسمبر عن نسخة جديدة من نموذج الذكاء الاصطناعي الرائد الخاص بها، جيميني، بهدف تشغيل الجيل القادم من الوكلاء الافتراضيين، مع تصاعد السباق المحموم بين شركات التكنولوجيا العملاقة للهيمنة على القطاع.
يُطلق على نموذج الذكاء الاصطناعي اسم Gemini 2.0، وهو قادر على إنشاء الصور والصوت جنبًا إلى جنب مع النص. كما يمكنه أيضًا استخدام أدوات مثل Google Search وMaps.
قال الرئيس التنفيذي لشركة جوجل، سوندار بيتشاي، في منشور على مدونته: “إذا كان هدف جيميني 1.0 هو تنظيم المعلومات وفهمها، فإن جيميني 2.0 يهدف إلى جعلها أكثر فائدة”.
وقال رئيس جوجل إن التطورات الجديدة في الوسائط المتعددة – مثل إخراج الصور والصوت الأصلي – واستخدام الأدوات الأصلية ستمكن الشركة من “بناء وكلاء ذكاء اصطناعي جدد يقربوننا من رؤيتنا لمساعد عالمي”.
يأتي هذا الإطلاق بعد عام من كشف جوجل لأول مرة عن عائلة Gemini من نماذج الذكاء الاصطناعي ، والتي تم بناؤها من الألف إلى الياء ومتعددة الوسائط بطبيعتها. كان هذا أول نموذج ذكاء اصطناعي من عملاق التكنولوجيا بعد دمج وحدات أبحاث الذكاء الاصطناعي ، DeepMind وGoogle Brain، في قسم واحد يسمى Google DeepMind، بقيادة الرئيس التنفيذي لشركة DeepMind ديميس هاسابيس في أبريل 2023.
وقال بيتشاي: “على مدار العام الماضي، كنا نستثمر في تطوير المزيد من النماذج الوكيلة، مما يعني أنها قادرة على فهم المزيد عن العالم من حولك، والتفكير في خطوات متعددة للأمام، واتخاذ الإجراءات نيابة عنك، تحت إشرافك”.
سيتمكن المطورون من الوصول إلى النموذج الجديد بدءًا من اليوم من خلال إصدار تجريبي من Gemini 2.0 Flash، المتوفر عبر Google AI Studio وVertex AI. كما سيتمكن المستهلكون في جميع أنحاء العالم من الوصول إلى إصدار مُحسَّن للدردشة من Gemini 2.0 من خلال روبوت الدردشة Gemini AI من خلال تحديده من القائمة المنسدلة للنموذج على سطح المكتب.
كما أطلقت جوجل ميزة جديدة تسمى Deep Research، والتي تستخدم التفكير المتقدم وقدرات السياق الطويل للعمل كمساعد بحثي، واستكشاف الموضوعات المعقدة وتجميع التقارير نيابة عن المستخدم. ستكون الميزة متاحة لمستخدمي Gemini Advanced، المستوى المدفوع من روبوت الدردشة Gemini.
وبالإضافة إلى ذلك، ذكر بيتشاي أن الشركة تعمل على جلب قدرات التفكير المتقدمة لـ Gemini 2.0 إلى AI Overviews، تجربة البحث التوليدية للذكاء الاصطناعي ، لمعالجة مواضيع أكثر تعقيدًا وأسئلة متعددة الخطوات، بما في ذلك معادلات الرياضيات المتقدمة والاستعلامات متعددة الوسائط والترميز.
وقال “لقد بدأنا اختبارًا محدودًا هذا الأسبوع وسنقوم بطرحه على نطاق أوسع في أوائل العام المقبل. وسنستمر في تقديم AI Overviews إلى المزيد من البلدان واللغات على مدار العام المقبل”. وسيتم توسيع النموذج ليشمل منتجات Google الأخرى في أوائل العام المقبل.
وتستخدم جوجل أيضًا Gemini 2.0 في نماذج بحثية جديدة مثل مساعد الذكاء الاصطناعي العالمي المستقبلي Project Astra؛ ومشروع Mariner، وهو نموذج أولي مبكر قادر على اتخاذ إجراءات في Chrome كملحق تجريبي؛ وJules، وهو وكيل كود تجريبي مدعوم بالذكاء الاصطناعي.
وقال بيتشاي: “نواصل إعطاء الأولوية للسلامة والمسؤولية في هذه المشاريع، ولهذا السبب نتبع نهجًا استكشافيًا وتدريجيًا في التطوير، بما في ذلك العمل مع مختبرين موثوق بهم”.