OpenAI发布人工智能新算法,糅合VR技术“教”会机器人自主学习

就在昨天,OpenAI向外界发布了其具有里程碑意义的一项研究——单次模仿学习算法(one-shotimitationlearning)。据悉,这种算法的绝妙之处在于允许人们使用虚拟现实工具来向人工智能传达任务指令,操作者只需要进行一次动作演示,之后人工智能就可以参照人类的动作进行模仿学习。

图丨Universe训练AI所用的游戏

本周,OpenAI又推出了用于机器人仿真的开源软件Roboschool,它基于增强学习研究平台OpenAIGym而开发的,提供了十几个新的操作环境,让用户可以在模拟环境中训练一个或多个机器人。

图丨Roboschool的训练画面

不过,相较以往,单次模仿学习算法的进步之处在于不需要人类操作者将动作反复重复,只要一次就足够人工智能来“领悟学习”。为了验证这一算法的可靠性,OpenAI进行了立方块堆叠的实验。

在实验中,OpenAI尝试“教”机械臂按顺序堆叠一批彩色的立方块,那么佩戴着VR设备的操作者就会首先在虚拟现实的环境中手动完成这一任务。然后,OpenAI就会使用其为机械臂专门开发的“眼睛”——视觉网络来仔细观察每一个动作。值得一提的是,视觉网络是一种基于成千上万个模拟图像而训练出来的神经网络,它是OpenAI早先很重要的一个研究项目,重点就是要用不断变化的模拟数据来强化对人工智能的训练。

但到这里,大家可能会有一个疑问,那就是为什么OpenAI没有选取现实世界中的照片或影像来供人工智能进行学习呢?毕竟这么做可以令机器人更直接的适应现实中的应用需要。其实,OpenAI的研究人员在这方面也是有所考量的。

首先,收集真实世界中的图像不仅费时费力,而且花费的成本也将是天文数字。反观模拟数据,可以更快、更有效率的达到相同的学习效果。也正因此,OpenAI为最新的人工智能算法提供的都是有着不同风格背景和纹理的虚拟图像。

另外很重要的一点,相较于真实世界的图像,人工智能算法在对虚拟图像进行分析的时候可以不用考虑现实场景的因素,可直接对机器人观察到的虚拟图像进行识别。

图丨OpenAI使用的虚拟图像

接下来,OpenAI的算法会将从视觉网络中收集到的信息传送给第二层神经网络——仿真网络,并以此来指导机械臂的动作。仿真网络的作用是分析出每一个动作背后的真实含义,并将其推广到新的应用场景中。那么它是怎么实现的呢?

而在立方块堆叠的应用案例中,该算法的训练目标就是要将不同摆放方式的立方块按相同的顺序搭成同样的“方块塔”。

图丨无论现实中的立方块如何摆放,机械臂都可以将它们摆成统一的样式

到目前为止,演示所用到的一切数据还只是模拟数据,而没有任何真实世界的影像或图片。OpenAI的技术人员JoshTobin解释说:“尽管机器人的动作与人类所演示的还略有不同,但它已经可以顺利地执行任务了。假以时日,或许人类只要进行一次演示,就可以让机器人毫厘不差地完成好各种不同的任务。”

图丨OpenAI的科学家JoshTobin

而OpenAI的研究团队也没有止步于此,他们的远期目标是让人工智能拥有快速学习的能力,并且可以适应环境中不可预测的变化。Tobin说,“人类的婴儿天生就拥有模仿别人的能力,而也正是这种能力使得我们可以快速的学习,我希望机器人也可以很快具备这种能力。”

事实上,不仅是OpenAI,越来越多的AI研究专家都在探索让人工智能变得无所不能的方法,为此,他们打造了可以自学、甚至可以互相学习的AI系统。而我们周围的世界和生活也正是因为这一次次的进步而变得更美好。

THE END
1.解锁“二分魔法”:让算法题轻松找到答案的秘密(1)二分查找算法(Binary Search)是一种高效的查找算法,核心思想是“分而治之”,适用于在一个有序的数组中快速定位目标值。通过反复将查找范围对半缩小,二分算法显著降低了查找的复杂度,从线性 (O(n)) 降到对数级别 (O(\log n))。它的关键在于精确判断中间元素与目标值的关系,并灵活调整上下界,从而迅速锁定答案https://blog.csdn.net/effort123_/article/details/144163803
2.鬼才数学老师:独创14个速算法,学生计算又准又快,大脑堪比计算机小学时期的计算能力,可以说决定这孩子学生时代的数学成绩,因为在计算上能避免出错的孩子,说明他是一个细心、反应能力快速的孩子。反之则是粗心大意的孩子,而细心是学好数学最需要的一种能力。 当了几十年的数学老师,在教学几十年的过程中也接触了很多家长和孩子。经常会有家长和我抱怨为什么同一个班,同一个老师教https://www.163.com/dy/article/DF92NJUS0516O6KF.html
3.算法之路到底该怎么走希望大家能够愿意尝试接触算法,了解算法,学习算法,即使能够坚持学习算法的人少之又少,但坚持的过程本身就是一种磨练。希望大家都能够收获绞劲脑汁AC时的自豪,看懂大佬题解时对其绝妙算法的赞叹!https://www.jianshu.com/p/cabc966267d6
4.诸葛武侯巧连神数,到底该怎么算?一、算法: 第一课 混沌初开,乾坤及定,日月合璧,凤凰合鸣。 第二课 苍蝇之飞,不过数步,附于骥尾,则腾千路。 第三课 莫言多,莫行过,虽是千伶百俐,不如一推二摩。 第四课 绝妙绝妙,云无心,以出岫鸟倦飞,而归巢,花艳艳,鱼跃跃几般佳。 https://www.360doc.cn/article/70612587_944534817.html
5.算法之美(Algorithms)书评我在08年初得知这本书,那会我还很奇怪:都什么年月了,怎么还有人写算法教材——这么“经典”的工作,不是上个世纪就被人做完了吗。读了这本Algorithms,我才知道:这才是我心中的算法书,我等待这样一本书已经很多年了。它的确当得起这个名字。书的三位作者:Sanjoy Dasgupta, Papadimitriou, Umesh Vazirani。其中,https://book.douban.com/review/1325850/
6.[PlantSimulation]GAWizard遗传算法的应用PlantSimulation除了提供常规的建模功能外,还可以通过额外的库来进行模型的优化,比如说遗传算法、瓶颈分析等,今天主要讲一下Tools中GAWizard的使用方法。 遗传算法是20世纪60~70年代主要由美国 Michigon 大学 John Holland 教授提出. 其内涵哲理启迪于自然界生物从低级、简单到高级、复杂,乃至人类这样一个漫长而绝妙的进https://www.pianshen.com/article/57411863425/
7.研修日志数学(精选9篇)因此,引导学生对算法进行优化是很有必要的,不过教师必须注意以下三点:第一、优化的主体是学生,而不是教师,教师绝不能定向性地规定学生用统一的方法去解题,而应把优化的主动权交给学生,优化的过程应该是学生进行自我反思,进一步比较、探索的过程,究竟哪一种算法好,要依不同的学情而定,只要学生通过比较、分析,认识https://www.360wenmi.com/f/filewe6q9siy.html
8.组合优化理论第11章启发式算法.pdf第11章 启发式算法 主讲人:陈安龙 2017年11月5 日 ? Combination Optimization PPT was designed by Chen Anlong, @UESTC.edu.cn 1 §1 模拟退火算法 §2 模拟遗传算法 2017年11月5日 ? Combination Optimization PPT was designed by Chen Anlong, @UESTC.edu.cn 2 本章介绍的启发式算法也称智能算法https://max.book118.com/html/2022/0612/6214234213004155.shtm
9.比你更了解你:算法已经无可匹敌了吗?例如如何用“高斯绝妙定理”[1]正确拿一块比萨。这实在太好了。我再也不用为耷拉下来的比萨发愁了(馅儿会掉),学会卷着拿,精准地送到嘴里。这种感觉很棒,就像一个外国人学会了拿筷子夹花生。除了高斯,黑客们的超级明星还有乔治·布尔,他们的理论(高斯函数[2]、布尔逻辑[3])和更多数学分支,成就了今天的算法https://china.caixin.com/m/2017-08-22/101133731.html
10.最快的开平方sqrt算法,供赏析51CTO博客最快的开平方 sqrt 算法,供赏析,最快的开平方sqrt算法,供赏析https://blog.51cto.com/990487026/1941559