谷歌AI的七个“不正经”玩法,个个能玩一整天
谁说AI只能搞一些一本正经的工作?
谷歌最近就放出了几只比较搞笑的AI,可以完成一些不走寻常路的工作,比如:帮你实现靠脸吃饭,让你说的跟唱的一样~
是谓:谷歌AI的七个“不正经”玩法。
每个我都能玩一整天~
玩法1:跳着舞就把琴弹了
正常人弹琴,都是乖乖的坐在钢琴前按键盘,或是以演奏姿势抱着吉他、手风琴弹。
但是谷歌这个名叫Body Synth的项目不一样,是让你在电脑前,以手为键,以腿为弦,手舞足蹈,自己弹自己。
先看一下效果,请欣赏由量子位带来的谷歌AI乐器独奏:《和弦》
其中的原理很简单,打开摄像头,自动开启人体姿态识别,四肢和脑袋分别对应不同的音调。
只要监测到身体某个部分有动作,就可以发出对应的音调。
跟我念,
1~2~3~4~5~6~7~
do re mi fa so la si~
以默认的C大调为例,摇头晃脑,发出的就是so的声音。
动动左手,就是mi。
动动右手,就是do。
动动右腿,就是低音so。
动动左腿,就是低音do。
即使转身背对镜头,也是一样可用。
另外,你还可以设置音色音调。
或者打开语音控制开关,默认的音色是吉他,喊一声strings,就可以变成管弦乐,喊一声drums,就可以变成鼓点。
玩法2-5:靠脸吃饭
除了“靠四肢弹琴”,还可以“靠脸吃饭”。
当然,不是真的靠脸吃饭的意思,而是你可以用脸来完成一系列工作(混口饭吃)。
比如说,依靠Sound Canvas工具,你就可以用脸来画画或者写字。
打开Sound Canvas之后,默认是用键鼠来画画。
这太低级了,简直是windows 98自带画图程序的水平。
所以,需要先把Tracking改一下,选中Body,就可以打开摄像头,用脸画画了。
此时,你脸的朝向就是屏幕上画笔的位置,慢慢移动自己的脑袋,微微转头,就可以在屏幕上勾勒线条。
比如,写“量子位”三个字。
人呀,一旦发现了脸的用途,就开始开发新工具。
除了写字,还可以弹琴。
Keyboard就是用来弹琴的。和用脸写字的操作差不多,脸的朝向就是小圆点在屏幕上的位置,操控小圆点敲击屏幕上的琴键,就可以发出对应的声音。
和前面的“跳舞弹琴”一样,Keyboard上也可以选择不同的音色音调,如果你觉得只有5个音不够发挥的话,可以设置到最多15个琴键,两个八度足够演奏很多音乐了。
当然,两个八度的话,琴键太窄了,脸太大不好操作,可以切换回鼠标操作……
熟悉了之后,还可以玩Clarion Lite,虽然也是一个用脸弹琴的项目,不过做了几种不同的花样。
屏幕上的每个彩色区域都应对这一个音调,同样用脸把小圆点放上去即可触发,摇头晃脑,乐声出现。
但是,演奏乐曲对音乐知识还是有一点要求的,有没有小白即刻上手(上脸)的操作?
没问题,谷歌还准备了“用脸当DJ”的Sampler项目,包含鼓点、吉他、号角、古钢琴四段简短的音乐,只要用脸控制小圆点移动上去,就开始自动播放。
现在,请欣赏下一个节目,由量子位为大家演奏《靠脸吃饭的音乐家》。
(中间有一段大家熟悉的歌,听出来的朋友评论区见)
玩法6:说的跟唱的一样
我有个同事,就是雷军的粉丝,不是米粉,单纯就是B站鬼畜区知名歌手雷布斯的粉丝。
鬼畜简单来说,就是通过调音,把一句话变成歌声~B站上个个都是人才,但对于普通人来说,这种操作还是很难。
不妨试试这个Word Synth吧~
你只要输入一些单词,然后就能按照自己的喜好调节旋律,探索不同的声音、声调的组合,尝试构建鬼畜一般的歌声。
我们尝试了一下,限于只能放三个视频,这里就用一个动图和一个音频呈现了:
这个项目背后,主要应用了谷歌云的文字转语音API,它靠DeepMind开发的WaveNet来合成你听到的这些声音。
玩法7:用声音画画
这其实是一个音乐可视化的工具。
所谓的音乐,既包括人声也包括多种乐器。你可以打开麦克风自己哼唱,也能调用内置的声音看看效果。
所有输入的声音,能够以不同的模式呈现,比方Hilbert Scope以及Spectrogram,能够显示出声音的细致纹理和旋律的形状。
据一位聋人音乐家表示,这个工具还能更好的帮助他们在听不到或者听不清声音的情况下,更好的学习歌唱。
正经揭秘
但,谷歌搞出这么多奇妙的功能,并不是只想让你玩一天而已。
所有以上这些,是一个被称为Creatability的项目,旨在探索如何通过网络和AI技术,让更多人能够释放自己的创造力。
纽约大学的Claire Kearney-Volpe,曾经作为艺术治疗师遇到过各行各业的人,她认为每个人都能从参与创作的过程中受益。
例如通过画画、制作音乐等方式,帮助患有自闭症的中学生;借助不同的技术手段,为盲人构建工具以完成晚宴的规划和设计。
正是秉持着同样的目的,她和谷歌团队、无障碍社区的伙伴合作,共同搞出了Creatability项目。
在这个项目的帮助下,即便你听不见,也能参与音乐创作。即便你行动不便,可以对着屏幕动动手指或者脑袋,也能感受到音乐的魅力。
在谷歌的宣传片中,行动不便人士的笑容真的很灿烂。
这一项目背后的AI动力,主要是谷歌的TensorFlow.js等工具,让机器学习技术能够在浏览器中实现。
无论你是老师、学生、研究人员还是艺术家,都可以参与其中。你可以玩,也可以利用相关技术,开发并提交自己创造的项目。
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
恒大汽车 2023 年净亏损 119.95 亿元,努力改善经营状况
日赚0.82亿 比亚迪2023年净利润300.41亿元,同比大涨80.72%
苹果WWDC 2024将于6月10日举行,或将推出生成式AI技术
苹果A18 Pro芯片细节曝光:采用更大尺寸 以提升AI性能
阿里撤回菜鸟上市申请 拟37.5亿美元收购菜鸟少数股东股权
AI造富能力一流
飞书开启裁员 全员信称会提供补偿方案或转岗机会
消息称小红书2023年首次实现盈利 但IPO前景仍不明朗
更多
- 小米再向前:小米SU7正式发布、引领汽车“智能化”下半场,「人车家全生态」全面开启
- 扬帆起航!小鹏汽车宣布正式进入德国市场
- Google 2023年移除超55亿条不良广告 9成由AI发现
- 中国移动全球首发5G-A商用部署 首批百城 年内扩至300+城
- 紫光同创推出Logos系列高性价比车规级FPGA芯片
- AI驱动营销创新Taboola Agency Award 2023名单公布
- IAR率先支持瑞萨首款通用32位RISC-V MCU
- 小米汽车上市发布会今晚7点召开 雷军确认小米SU7标准版CLTC工况续航700公里
- 最终悬念,小米SU7卖多少钱合适?
- Keep发布全新8.0版本 将投入AI资源提升运动课程生产
更多
- 全球生成式人工智能领域去年或有近700笔投资交易 总额291亿美元
- 华尔街预计特斯拉Q1交付47.1万辆电动汽车 但也有分析师预计低于43万辆
- 苹果WWDC24还有望推出Mac Studio 但Mac Pro可能要下半年
- 亚马逊再向AI初创公司Anthropic投资27.5亿美元 兑现40亿美元投资承诺
- 消息称苹果在测试一款新Apple Pencil 有望用于Vision Pro
- 现代汽车计划到2030年将电动汽车增至31款 韩国年产能增至151万辆
- 消息称苹果没有在iOS 18等新一代系统中引入自研AI聊天机器人计划
- 被美国司法部起诉垄断后 苹果在美国又面临至少3起集体反垄断诉讼
- 航拍显示特斯拉上海储能工厂准备动工 厂区内已有施工设备
- 消息称苹果不会在今晚宣布新iPad Air和iPad Pro 还得再等等