谷歌最新AI实验:人人都是指挥家 实时生成交响乐

[导读] 如果你是一位古典乐发烧友,而且有做乐团指挥的梦想,听见古典乐就走不动道,就算没有乐队,也能自己对着空气手舞足蹈指挥一番,那么恭喜你,谷歌最新的人工智能实验项目简直就是为你量身定制的。而且,不用担心旁边有人对你指手画脚。

gg1901054

如果你是一位古典乐发烧友,而且有做乐团指挥的梦想,听见古典乐就走不动道,就算没有乐队,也能自己对着空气手舞足蹈指挥一番,那么恭喜你,谷歌最新的人工智能实验项目简直就是为你量身定制的。而且,不用担心旁边有人对你指手画脚。

这个项目名为“半导体”,其中融合了谷歌过去一系列机器学习实验中的最新成果。包括AIDuet(邀请用户在浏览器中播放虚拟钢琴演奏,并提供虚拟伴奏),以及AutoDraw(可以解释用户绘制的粗糙涂鸦是什么,并将这些画作转变成为整洁的剪贴画)。

 

gg1901053

该项目可以跟踪用户的动作,就像用户在真正的管弦乐队前挥舞双手一样,并根据对用户动作的分析结果,实时生成一段交响乐。

想试试吗?只需在谷歌浏览器中启动“半导体”,允许其访问网络摄像头权限,然后面向摄像头后退一步,直到你的手臂位于屏幕内的框架中,就可以开始指挥自己的“乐队”了。不一定非要使用传统的指挥手势,本项目会提供建议提示,帮助你一路顺利完成指挥。

 

全程无需指挥棒 随意放飞自我

本项目背后的核心技术是PoseNet,这是一种面向姿势估计的机器学习模型,可以在浏览器中对人的姿势和动作进行分析和估计。它无需任何专门的硬件或软件,即可检测到图像和视频中的人物形象。

 

微信图片_20190105152846

 

最重要的是,因为所有处理都在浏览器中进行,所以无需向Google或其他任何人发送任何数据,因此你可以完全自娱自乐,无需担心由于数据泄露引发的一些不必要的尴尬。

这个项目可让用户通过浏览器管理自己的管弦乐队。你可以通过移动手臂,来改变交响乐的速度、音量和乐器种类。该项目使用PoseNet,这是一个可在浏览器中使用的机器学习库,通过网络摄像头捕捉动作。

PoseNet使用来自现场乐器演奏时录制的数百个微小音频文件,算法会根据捕捉到的动作信息播放这些音频。

关于PoseNet和姿势估计

姿势估计指的是检测图像和视频中的人物形象的计算机视觉技术,比如可以确定某人的肘部出现在图像中的位置。需要明确的是,这项技术无法识别图像中的人物身份。该算法仅仅是估计关键身体的关节在图像中的相对位置。

姿势估计有许多用途,比如用于基于身体反应的交互式装置,以及增强现实设备、动画制作、健身等用途。过去,虽然许多的姿势检测系统是开源的,但都需要专门的硬件或摄像头,以及相当繁复的系统设置。

由于TensorFlow.js上的PoseNet在可浏览器中运行,只要有网络摄像头,任何人都能在浏览器中体验这项技术。目前该模型已经开源,Javascript的开发人员只需几行代码即可使用。更重要的是,这实际上可以更好地保护用户的隐私。

未经允许不得转载:数智网 » 谷歌最新AI实验:人人都是指挥家 实时生成交响乐

分享到: