新闻中心

您当前的位置: 首页 > 新闻中心 > 行业新闻

不朽情缘斯坦福设立建设AI音频数据征求编造能让机械人占定杯中是否有骰子

发布时间:2024-07-06 06:16:35 浏览:

  而今,大大批人为智能驱动的呆板人都应用摄像头来清楚方圆境遇并研习新职责,但用音响锻炼呆板人正变得越来越容易,可能帮帮它们更好地适合能见度有限的职责和境遇。

  固然视觉很首要,但正在平素职责中,音响实践上更有效,比方通过洋葱正在炉子上嘶嘶作响的音响,来决断锅的温度是否相宜。

  然而,用音响锻炼呆板人只正在高度受控的实践室境遇中实行,况且这些时间落伍于其他疾速呆板人锻炼形式。

  美国斯坦福大学呆板人与人为智能实践室的钻探职员正发端转移这一近况。他们最先创造了一个采集音频数据的体系,包含一个 GoPro 相机和一个带麦克风的夹持器。该麦克风可能过滤境遇噪声。

  人类演示者会带着配置实现各式家庭职责,然后应用这些数据教呆板臂若何单独实施职责。

  “到目前为止,呆板人平昔正在无声的视频上锻炼杯子不朽情缘斯坦福设立建设AI音频数据征求编造能让机械人占定杯中是否有骰子。”斯坦福大学博士生、该钻探的要紧作家 Zeyi Liu 说,“但音频中有许多有效的数据。”

  为了测试假若呆板人不妨“听见”,以及它能博得更好的成果,钻探职员拔取了四项职责:正在平底锅里翻转百吉饼、擦白板、把两条尼龙条粘正在一同、以及从杯子里倒出骰子。

  正在每项职责中,音响城市供应摄像头或触觉传感器难以措置的线索,比方显露橡皮擦是否准确接触到白板,或者杯子里是否有骰子。

  正在对每项职责实行几百次演示后,钻探幼组比拟了应用音频锻炼和仅应用视觉锻炼的胜利率。联系论文揭晓正在一个未经同业评审的预印本网站上。

  当正在骰子测试中只身应用视觉时,呆板人可能正在 27% 的韶华里确切决断杯子里是否有骰子,但当包含音响时,这一数字上升到了 94%。

  这项钻探的实践室担当人 Shuran Song 体现,这不是第一次将音频用于锻炼呆板人,但这是朝着大领域锻炼迈出的一大步:“咱们正正在让从‘真正全国’采集的音频更容易应用,而不是限度于正在实践室采集,由于这更耗时。”

  这项钻探讲明不朽情缘不朽情缘,正在用人为智能锻炼呆板人的竞赛中,音频大概会成为更受接待的数据源。

  他们向呆板人呈现了数百个正正在实行中的职责的示例,而不是人为编码每个职责杯子。

  假若可能应用钻探中的配置大领域采集音频,这将给呆板人一种全新的“觉得”,帮帮它们更速地适合能见度有限或看不见的境遇。

  美国密歇根大学呆板人学副教育德米特里·贝伦森(Dmitry Berenson)没有参加这项钻探,他说:“可能相信地说,音频是(呆板人)感知钻探中最缺失的地方。”

  这是由于锻炼呆板人把持物体的大片面钻探都是针对工业分拣和就寝职责,比方将物体分类到垃圾箱中。

  但贝伦森说,跟着呆板人的运用边界扩展抵家庭、厨房和其他境遇中杯子,音频将变得越来越有效。

  假设一个呆板人试图找到哪个包或口袋里有一串钥匙,但可见性有限。贝伦森说:“正在你摸到钥匙之前,你就能听到它们碰撞的音响。这讲明钥匙就正在谁人丁袋里,而不是其他的。”

  只管这样,音频照旧拥有限度性。该团队指出不朽情缘,音响对衣服等质地柔嫩或天真的物体没有那么有效,由于它们不会发出那么多可用的(成心义的)音响。

  呆板人正在实施职责时也很忧伤滤掉我方发出的噪音,由于人类爆发的锻炼数据中不存正在这种噪音。

  为清楚决这个题目,钻探职员必要将呆板人的“音响”和致动器噪音增加到锻炼纠集,如此呆板人就可能学会将它们过滤掉。

  Liu 说,下一步是看看这些模子是否能用更多的数据取得多好的结果。这大概意味着加多更多的麦克风来采集空间音频,并将麦克风集成到其他类型的数据采集配置中。

Copyright © 2012-2023 不朽情缘·(中国)集团有限公司-官网 版权所有  备案号:琼ICP备xxxxxxxx号

搜索