倫敦南方的 DeepMind 實驗室內,兩隻由人工智慧驅動的機器手臂,從 2022 年至今持續展開一場沒有終點的「乒乓球延長賽」。與一般的競技不同,這場對戰不追求勝負,而透過不斷的交鋒與回合對打,讓手臂從每次擊球中學習新策略。研究團隊表示,這種「邊打邊學」的模式,正是推進機器人適應真實世界複雜環境的重要關鍵。
這對機器手臂由 Google DeepMind 開發,被視為未來人形機器人的核心。最初,機器手臂只是簡單的來回擊球,工程師接著逐步提高難度,增加競爭機制,讓機器手臂開始追求得分,發展出各種取分策略,卻也暴露出「邊學邊忘」的困境,經常在適應新策略時遺忘舊戰術,導致回合快速結束。
為了改善這個問題,工程師請來真人陪練,在對抗變化多端的人類時,機器人才顯得更穩定,也制定了多樣策略,最終統計,機器手臂與人類進行了 29 場比賽,勝率為 45%,對中階玩家更達到 55% 的勝率,可說是遇強更強。
為了加速突破瓶頸,DeepMind 團隊進一步引入 Google Gemini 視覺語言模型做為機器手臂的「AI 教練」。Gemini 分析乒乓對戰影片,給出「朝右邊擊球」或「加強網前短球」等自然語言反饋,彷彿教練在場邊指導一般,讓機器手臂能更快速且有效地調整擊球策略。
研究團隊指出,選擇乒乓球做為訓練平台也並非偶然。這項運動具備高速反應、精準動作控制與多樣化策略等特點,且成本低廉,非常適合用來培養通用型機器人的各種能力。
希望透過持續學習與實戰經驗累積,逐步縮短機器人從實驗室走向實際應用的距離,打造出能真正融入家庭、工廠及各種日常環境的智慧型夥伴。
(首圖來源:影片截圖)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:芝加哥乐队)
他们的日常生活是疯狂攒稿——最早是直接搬运,一字不改地抄袭,后来各大平台上线了原创保护后,同平台抄袭变成了跨平台抄袭,比如从头条号里抄一篇发到百家号里,一些熟练的做号者,还...[详细]
虽然《王者荣耀》也是为了赚用户的钱,但是它给了用户选择的空间,给了用户足够的时间来对用户自己的付费节奏进行把控,不逼用户付费,只是通过游戏本身的内容来索取用户的游戏时间,毕竟用户在你的游戏中花费时...[详细]
4.负责网站的内容合作、资源互换等事宜,旨在提升网站数据指标。...[详细]
有了这种数据驱动的方法,你就能处理网页问题并建立搜索引擎和用户都喜爱的网站啦~ 原文地址:http://internet.com/web-101/how-to-do-a-content-audit-...[详细]
团队买书可以报销,而且一定要多买,不看书的要做检讨。...[详细]
因为搜索引擎喜欢新的内容,这样做对提升网站整体排名有很大的帮助。...[详细]
曾经有这么一句名言:互联网让聪明人更聪明,让傻瓜更傻瓜。...[详细]
群脉 首先新媒体所需的超高流量和所拥有的庞大数量级的受众对一个极其健壮的功能系统的需求很强,只有功能健全的大数据支持与分析平台,才可以保障正常的业务运营并降低系统风险发生的概率。...[详细]
到底是网友不出门,还是路人不上网? 讲真,这句评价还是有偏颇的,毕竟,这件事情,男子和两个女孩都有不对的地方,而且,随便一搜还是能发现不少见义勇为的事情,一棒子打死并不妥。...[详细]
从P2P共享租车转型电动车分时租赁,友友用车在烧完2000万美元融资后一夜消失?在接到用户的爆料后,记者实地走访了友友用车的几个办公地点,发现早已人去楼空。...[详细]