9-р сарын 26-нд АНУ-ын Google компани роботод зориулсан шинэ хиймэл оюун ухааны загварууд болох "Gemini Robotics 1.5" болон "Gemini Robotics-ER 1.5"-ыг танилцууллаа.
Эдгээр загварууд нь тус компанийн “Gemini” хэмээх том хэлний загвар (LLM)-ын технологид суурилсан бөгөөд 3-р сард танилцуулсан өмнөх роботын AI загварын шинэчлэгдсэн хувилбар юм.
Эдгээр загварын гол давуу тал нь:
Хүндрэлтэй үүрэг даалгаврыг бие даан задлан шинжилж, роботыг удирдан гүйцэтгүүлэх чадвартай байх явдал юм.
Gemini Robotics 1.5
Харааны мэдээлэл, хэлний заавар, үйлдлийг нэгтгэж роботыг шууд удирддаг загвар
Үүнийг VLA (Vision-Language-Action) загвар гэж нэрлэнэ
Gemini Robotics-ER 1.5
Хараа болон хэлний мэдээллийг нарийн ойлгож, даалгаврын төлөвлөгөө боловсруулдаг
Үүнийг VLM (Vision-Language Model) гэж нэрлэнэ
Ашиглах зарчим:
Gemini Robotics-ER 1.5 нь хүний өгсөн зааврыг ойлгож, веб хайлт зэрэг хэрэгслээр шаардлагатай мэдээлэл авч, гүйцэтгэх төлөвлөгөө боловсруулна.
Gemini Robotics 1.5 нь энэхүү төлөвлөгөөнд үндэслэн даалгаврыг жижиг алхмуудад хуваан, роботын үйлдлийг шат дараатайгаар гүйцэтгүүлнэ.
(Эх сурвалж https://www.itmedia.co.jp)