AI绘画火得,AI唱歌火不得?

以下文章来源于果壳硬科技 , 作者干麻鸭AI绘画火得,AI唱歌火不得?
文章图片
来源|果壳硬科技作者|干麻鸭编辑|一萌同样是AIGC , 有些人正在用AI源源不断地生成梗图 , 有些人则用AI生成音乐;同样是AIGC生成音乐 , 有些在模仿人类 , 有些在复刻经典 。 AIGC是个工具 , 在不同人的手里产生不同的价值 , 这个数字可能高达数万亿美元 。 [1]在AIGC面前 , 还有谁不跪下临近2022年尾声 , AIGC成为今年最受关注的技术关键词之一 。 只需要几句描述 , 就能让AI进行联想并作画 , 通过最直接、最快速的视觉反馈 , 给人类对艺术的常规理解带来冲击 。 AI绘画火得,AI唱歌火不得?
文章图片
属于比较不怎么样的AI绘画通过上一篇文章《AI绘画火得,AI唱歌火不得?
文章图片
Gartner发布的2022年技术成熟度曲线[3]虽然目前AIGC在视觉上的竞争更加充分、发展更快 , 也更吸引眼球 , 但是音乐作为人类文化与情感的重要载体 , AI其实也在对该产业进行改造——只是更加潜移默化 。 标签、算法、神经语言识别等功能 , 几乎成为音乐类App的标配 , 它们可以自动生成歌单并推送给用户 。 现在你打开QQ音乐 , 应该有不少人把选择权直接丢给了“每日30首”和“个性推荐” 。 如果谁想体验一下音乐品位被嘲笑的感觉 , 那AI也可以提供贴心服务 。 2020年底 , 网络杂志《ThePudding》推出了一款人工智能应用“HowBadIsYourSpotify?”[4] , 该应用的数据库里输入了数以百万计的Pitchfork评论、reddit帖子和唱片店推荐 , 通过分析用户的Spotify播放列表 , 在嘲笑其音乐品位过于“初级” , 或痴迷某个歌手“到了令人不舒服的程度“ , 热情的Twitter用户甚至曾一度挤爆了Pudding网站 。 AI对音乐的改造没有止步于兴趣分析或者品位鉴赏 。 2014年播出的美剧《天蝎计划》(Scorpion , S2E8)中 , 讲了一个在当时颇为科幻的故事:一名博客音乐家写出了可以不断制造“神曲”的程序 , 却因此招来杀身之祸——凶手正是另一个运用程序写歌谋利的创作者 。 8年过去 , 在大平台们的努力下 , 《天蝎计划》中的幻想很快成了现实 。 AI终于打算真实地对音乐创作过程下手了!他们都在玩AIGC , 他们都有美好的未来2016年6月 , 世界上第一首人工智能创作出的90秒钢琴音乐作品诞生 , 它来自谷歌与加州艺术学院联合推出的“Magenta”项目 。 此后 , AIGC音乐越来越多 , 底层技术则分为两条路子 。 一条路子 , 是“自动作曲” 。 2017年 , 索尼CSL(计算机科学实验室)人工智能程序FlowMachines推出的《老爸的车》(Daddy’sCar) , 就是AI作曲的成绩 , 号称“第一首完全由人工智能创作的完整歌曲”;微软的AI则通过分析学习几十首圣诞颂歌 , 推出过一首名为《城市欢乐时光》(JoyfulTimeinTheCity)的AI歌曲 。 比起90秒作品 , 完整的AI自动作曲可谓前进了一大步 。 但它们仍需从人类浩如烟海的历史音乐作品中汲取灵感 , 是人类艺术灵感的延伸 , 像《老爸的车》这样的作品 , 作曲和编曲由AI完成 , 和声与填词由人类作曲家帮助搞定;《城市欢乐时光》也需要人类辅助完成 。 其实 , 这类音乐作品谈不上“完全由人工智能创作” , 更多是技术圈地自萌 , 听众实际接受度得打个问号 。 另一条路子 , 则主打“AI自动合成音乐作品” 。 比如腾讯音乐阿波罗声音实验室研发的声音合成技术引擎“凌音” , 高度还原和复刻歌手的声音特点 , 重现艺人经典声音 , 首位AI歌手发布于今年7月 , 基于杨超越的声音合成 , 只需要歌手10分钟左右的录音就能很好地复刻出原声 , 甚至可以在演唱中带“感情” 。 此后的成熟作品有《没有寄出的信》(复刻和重现邓丽君的声音) , 《愿你被这个世界温柔以待》(复刻和重现梅艳芳的声音) 。 “自动作曲”与“凌音引擎”的不同之处是 , “自动作曲”模仿音乐 , “凌音引擎”是使用自主设计的深度神经网络模型 , 加上既有声音风格元的“合成音乐” , 后者并不避讳使用了人类历史上精华艺术作品 , 并复刻这些艺术风格 。 这也是AIGC类音乐的另一个发展方向——与其让机器搞原创音乐 , 不如让机器辅助人创作音乐 , 并且比起单纯的输出歌曲 , 还可以做得更多 , 改变我们过往体验音乐的方式 。 谷歌AI音乐项目Magenta的技术负责人道格拉斯·艾克(DouglasEck)在接受《科学》杂志(Science)采访时认为 , AI已经是国际象棋高手 , 但如今已成为人类棋艺精进的帮手 , 音乐也一样 , 如今不管机器学习速度有多快 , 人类都能以更快速度适应和利用AI技术来辅助创作 , 玩出新意[5] 。 说得直白点 , AI大可不必取代人类 , 做个趁手的工具也挺好 。 而最需要AI工具生成内容的 , 可能不在现实 , 而在虚拟世界 。 也就是 , 如何把“中之人”彻底数字化 。 把AI用到刀刃上AIGC的音乐进化到今天 , 已经不同于过往的自动语音合成技术 , 而是具有更高复刻度 , 引擎渲染后的AI声音在音色、语气上与真人更加接近 , 在演唱上也更有表现力和“感情” 。 目前“凌音”技术不仅能让AI演唱(官方称“合成“)已存在的曲目 , 用户也可一键定制由AI作词、谱曲、演唱的合成歌曲 。 在这种环境下 , 人们面对的问题是:如何让元宇宙数字人唱跳Rap打篮球?这并不容易 , 因为视频世界中不仅需要音乐 , 还要求具备音乐(乐器/人类)的声音、口型、表情、动作等元素 , 更丰富的场景下 , 还需要舞蹈、运镜、灯光……如果你使用腾讯音乐天琴实验室的“MusicXRMaker系统” , 完全可以实现这些需求 , 而且应用场景多样化 , 该系统的首位虚拟人小琴于今年10月推出 , 用AI驱动的方式 , 基于音乐去生成舞蹈表演和歌唱元素 , 目的是提升运营效率和虚拟人的真实、趣味性 。 这也给会议、客服、新闻播报等场景提供了更好的解决方案 。 据了解 , 很快也将会有一位从“次世代”远道而来、经过层层遴选的“超级歌手”在TME出道 , 或许她将颠覆我们对唱歌的想象 , 成为开辟“音乐虚拟偶像元年”的天降紫微星 。 “不同于大投入定制化的头部虚拟偶像 , 我们希望将MusicXRMaker打造成一套高效率、低成本产出数字人的平台 , 同时让数字人具备更强的实时内容生产能力 , 让任意音乐、舞蹈、舞台等元素的互动结合成为可能 。 ”QQ音乐技术副总裁周文江谈到 。 元宇宙的AIGC音乐也得赚钱啊2022年 , 扎克伯格100亿美元烧出来的元宇宙社交平台地平线世界(HorizonWorlds)留存量感人 , 今年10月16日 , Meta内部文件被曝光 , 其中显示地平线世界的月度活跃用户数量不足20万 , 远未达到原本50万的预期 , 且兴趣时长仅仅一个月 。 说来好笑 , 作为一个虚拟世界 , 元宇宙最缺的却是人 , 最难的是打造一片好的土壤来吸引人共同创作 。 相比较来说 , 国内另一个元宇宙案例则更为务实 , 今年7月16日 , 腾讯音乐旗下的虚拟音乐嘉年华TMELAND联合百事可乐打造了一场沉浸式虚拟3D演出 。 这场虚拟化音乐演出为元宇宙实验提供了内容和主题 , 而这次商业合作 , 也给未来虚拟场景营销提供了“标准模板” 。 这可能是国内AIGC领域第一个大商业客户买单的案例 。 诸多品牌主加持到元宇宙的内容共建中 , 也将丰富生态 , 形成有一个有生命力的营销场景 。 纵观音乐产业 , 从早期的1.0唱片时代音乐内容的输出集中在少数有资源的专业人士手中;进入到2.0流媒体时代 , 更多音乐从业者参与进来 , 推荐和分发机制让他们得到了展示机会;随着3.0的到来 , AIGC甚至让音乐消费者也拥有反向输出和参与共创的能力 。 持续加强对AI的投入 , 音乐平台的未来或许是一块比想象中更肥沃的土壤 。 足够多的高粘性用户、人对音乐永不厌倦的欣赏、已经培养成型的付费习惯、逐步推进的共创工具(不直接介入创作甚至还能够避免版权纷争)、多元化的场景碰撞 , 谁说音乐平台不是一块比游戏化的元宇宙更佳的土壤呢?“元宇宙从来都不是一蹴而就的事情 , 我们可以利用我们已经成熟的技术 , 去实现一个基础的版本 , 然后不断的去提升各项技术 , 去完善元宇宙体验 。 ”针对音乐+AI的更多可能性 , 天琴实验室计算机视觉负责人董治说到:“我们在AI驱动上的核心能力 , 它们都有一个共同点 , 就是通过音乐 , 用AI的方式 , 去生成虚拟世界的各项基础元素 。 “关于AI艺术的一些后话从AI写稿 , 到AI作画 , 再到AI音乐与视频 , AIGC始终面临一些争议:如果生成的内容不够好 , 那它存在的意义是什么?如果它生成的内容足够好(且这可能是未来的必然) , 那它会激起新一轮职业替代恐慌吗?人类的精神娱乐生活会被AI接手吗?这也许是一系列纠缠恒久的话题 。 技术乐观主义者经常会说 , 工具的好坏取决于使用者的目的 。 实际上 , 互联网一直在做的 , 就是让更多人更方便地享受到科技提升带来的乐趣 , 音乐领域也如是 。 如果我们在国内把凌音引擎、MusicXRMaker等工具开放给所有有需要的音乐人、制作机构或者内容公司 , 再通过音乐元宇宙和AIGC帮助听众尽快进入到虚实结合的音乐体验中 , 未来甚至成为全民在音乐领域共创的得力工具 , 让每个人能按照自己的想象去制作音乐 , 享受音乐 , 那也许是个更值得期待的未来 。 *References:[1]GenerativeAI:ACreativeNewWorld2022.9.9https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/[2]Predicts2021:ArtificialIntelligenceandItsImpactonPeopleandSocietyhttps://www.gartner.com/en/documents/3995104[3]What’sNewinArtificialIntelligencefromthe2022GartnerHypeCyclehttps://www.gartner.com/en/articles/what-s-new-in-artificial-intelligence-from-the-2022-gartner-hype-cycle[4]HowBadIsYourStreamingMusic?https://pudding.cool/2020/12/judge-my-spotify/[5]Science:HowGoogleismakingmusicwithartificialintelligencehttps://www.science.org/content/article/how-google-making-music-artificial-intelligencedoi:10.1126/science.aan7216