站点出售QQ:1298774350
你现在的位置:首页 > 演出资讯  > 歌剧话剧

没有人类参与的AI音乐才会趋于平庸|破晓访谈

发布时间:2026-01-23 20:15:20  浏览量:3

生成式人工智能(GenAI)引爆了一场深刻的生产力范式革命。在文化产业领域,既有的内容创作、价值生成、商业模式与消费形态等正面临着全面重塑,引发全行业对未来的深刻追问。腾讯研究院与中国传媒大学文化产业管理学院合作推进《GenAI重塑文化产业》研究项目,聚焦GenAI在长视频、短视频、音乐、动画、网络文学等重点领域的应用,分析多领域产品、产线、管线的变化趋势,探索文化产业智能化发展路径。期望汇聚技术涌现的“智能之光”与人类永恒的“智慧之光”,迎接文化产业变革时刻。继前四期专题访谈之后,本期我们聚焦腾讯音乐娱乐集团(以下简称TME),与腾讯音乐曲库版权高级总监,酷狗内容运营总监兼启明星AI音乐项目负责人李玲玲,共话音乐产业在GenAI时代的技术变革、模式创新、版权困局与创新突破。

本期嘉宾:李玲玲腾讯音乐曲库版权高级总监&酷狗内容运营总监,启明星AI音乐项目负责人 课题组:中国传媒大学文化产业管理学院:刘江红、田卉、陈娴颖、李苏怡腾讯研究院:孙怡、田小军、冯宏声等

【观点速览】

1. GenAI对于音乐产业的核心价值:极大提升创作效率,在作词、成曲、演唱等环节均有应用。随着音乐大模型的迭代优化,AI音乐生成的整体质量不断提高。现阶段AI音乐创作或辅助人类创作主要是模仿,如果能够形成一个“生产-消费-反馈”的闭环,AI具有在模仿基础上形成新的音乐形式和流派的潜力。

2.音乐领域的“超级个体”现象十分凸显,主要赋能独立音乐人和普通用户。独立音乐人从“部分环节创作者”变为能独立操盘全流程的个体。普通用户实现从“消费者”到“创作者”的身份跃迁。当音乐创作门槛被AI大幅降低后,除了审美和创作能力,操盘能力和运营能力将变得至关重要。

3.GenAI是一把双刃剑,既释放生产力,也对平台的内容管理能力和行业的版权保护构成了巨大挑战。最终解决版权这一核心难题,需要法律、制度和整个行业形成有效共识,共同建立清晰的规则。

4.在功能性音乐中,AI已能全自动生成免费或极低成本的场景化音乐,带来积极变革;在消费性音乐中,投入了高审美和大量创意的创作者能利用AI生产突破性精品。探索“AI原生音乐”,创造人类无法实现的全新艺术表达,才是AI带来的创新增量。AI将把音乐推荐从“个性化”推向“场景化与实时生成”,未来趋势是基于实时数据和生活场景,生成符合用户需求、独一无二的音乐,这是深度个性化的核心方向。

访谈内容分享:一、目前GenAI在音乐产业的具体工作流程中,是如何体现降本增效的?主要集中在哪些环节?未来AI生成的音乐,有没有可能创造出目前人类创作音乐中没有的全新风格?李玲玲:GenAI带来的根本性改变,在于极大地提升了创作者端的生产效率,这半年来的进步尤为显著。半年前,AI在音乐创作中的应用还局限于作词、编曲、乐器适配等单一环节。但随着Suno等国内外大模型的崛起,AI在整体音乐生产上的能力有了巨大飞跃,产出的质量已经相当不错。从平台供给侧来看,独立音乐人的内容供给量已经达到了原来的2到3倍。其次是厂牌,他们背后有自己的工业化生产链路,所以效率提升虽然没有达到独立音乐人的几何级增长,但也有大幅提升。目前来看,真正高质量的AI音乐作品比例还不高。我们对AI内容的审核和管理标准实际上更严格,特别是对于可能涉及“洗盗蹭”的内容,会采取更严格的控制措施,以保护原创生态。从AI参与的环节看,首先是作词,其次是直接成曲。创作者使用AI编曲辅助工具也很常见。最后是演唱环节,换音的应用也比较多,用户可以用模型将自己的声音替换成其他音色进行演绎。腾讯音乐也有自研的音乐大模型,比如“文曲”专注于作词,领先行业声音演唱模型。对于AI能否创造出不同于人类创作的全新音乐?虽然现阶段主要是模仿,但我个人观点,未来这是有可能的。这其中的关键在于,AI拥有庞大的数据学习能力,并且如果能够形成一个“生产-消费-反馈”的闭环,它就有潜力在模仿的基础上找到创新突破点。这也是TME未来要重点发展自研大模型的优势所在,我们可以让AI生成的内容直接在用户端接受检验,收集消费数据和反馈,再将这些反馈用于迭代和优化模型。通过分析哪些内容能引发惊喜或突破,可以引导AI探索新的创作方向。二、生产效率提高后,音乐领域的“超级个体”现象是否更加凸显了?您认为他们具备哪些独特的核心优势和竞争力?李玲玲:是的,非常明显。我们可以把从业者大致分为三类:第一类是有完整团队支持的顶尖创作者;第二类是独立音乐人,自己负责创作、发行和宣传;第三类就是广大的听歌用户。在第二类当中,他们拥有很好的审美和市场嗅觉,比如制作人,但在GenAI出现之前自己不会写词、作曲或演唱。现在,借助AI工具完全可以独立操盘全流程,从创意沟通、打造歌曲到负责宣推,不再必须依赖特定的词曲作者或歌手。更大的变化发生在第三类人,即普通用户身上。他们可能只是音乐爱好者,缺乏专业知识和专业训练,但AI工具和一站式发布平台,让他们也能创作、发布甚至打榜。这种从“消费者”到“创作者”的身份转换,未来还有巨大的创新空间。我认为音乐领域的“超级个体”最重要的能力将集中在三个方面。第一是高级审美能力,对音乐有深刻的理解和品位。第二是AI调教与对话能力,懂得如何与AI模型有效沟通,引导其产出符合想法的作品。第三是情感与内容表达力。最终作品能否打动人,取决于创作者注入的情感深度和叙事能力。这要求创作者不仅要有理性(懂技术),更要有丰富的感性。因此,未来的音乐人需要的是更综合、更偏向创意与审美层面的素质。三、从结构来看,您认为这三类人会呈现怎样的形态,是“金字塔型”还是“橄榄型”?比如中间层的创作者数量急剧扩大,但头部顶尖创作者依然稳固?李玲玲:从大的结构上看,我倾向于是“橄榄型”。顶尖的创作者有其不可替代性,他们不仅拥有顶级的创作力,更有强大的粉丝基础和与用户的情感连接,这种地位短期内很难被AI动摇。但音乐行业和网文、短视频等领域面临一个共同的新现实:创作本身,因为AI的赋能已经不再是核心门槛了,发行和获取关注正成为新的、更大的门槛。用户的总时间和注意力是有限的,是一个几乎恒定的“流量池”。然而,内容供给却在爆炸式增长。在如此海量的新作品中,如何脱颖而出?因此,对创作者的要求发生了根本变化。除了审美和创作能力,操盘能力和运营能力将变得至关重要。一个创作者如果只会创作,但不懂如何经营自己、推广作品,很可能依然无法获得成功。所以从长期看,即便创作水平普遍提高,更多人进入“橄榄型”的中部,但决定其商业价值和影响力的关键,可能越来越取决于创作之外的运营能力。四、GenAI带来音乐作品海量增长,这是否给平台的音乐审核、分发和运营带来更大的压力?李玲玲:作为平台曲库与内容的直接管理者,我们面临的压力确实非常大。首先,从国家监管要求出发,必须对海量内容进行有效识别和审核。当前,完全自动化的审核技术还不够成熟,我们需要技术判断与人工审核双管齐下。其次,AI参与创作的环节非常复杂,涉及作词、作曲、生成、演唱等多个维度。为此,我们去年最重要的工作之一就是建立一套针对AI内容的管理标准体系。这包括制定详细的审核规范、开发反向识别算法,以及建立“算法初步识别 → 人工审核判断 → 算法持续优化”的闭环流程。再者,我们还要积极制定并推行面向创作者的规范,鼓励他们主动声明AI使用情况,并与厂牌等合作伙伴共同管理 AI作品的元数据、推动行业 AI 工具使用的标准规范。李玲玲:我们目前探索的授权合作,主要围绕具体的、可受版权保护的内容展开,一种是基于词曲的改编授权。我们会与词曲作者或代理公司洽谈,获取其作品的AI改编授权。允许用户基于原词曲进行二创,由此产生的收益会通过协议分享给原作者。这是一种新的宣发模式,能快速提升歌曲的传播度和互动性。不过,词曲作者对此仍比较谨慎,主要担心滥用和收益追溯问题。我们会通过活动授权、明确周期、建立完整收益追溯机制等方式来推进。另一种是歌手音色授权。歌手的音色是其最核心的资产,通常非常慎重,极少开放授权。我们接触到的案例,更多是“辅助性”或“延续性”的。例如,大家都知道,TME曾与王力宏合作,授权我们使用AI技术辅助制作专辑,以“AI王力宏”的形式传播,但作品仍完全归属于他。这都是获得本人明确授权后,用于服务其自身艺术发展的。 另一方面,版权保护和管理也是当前最敏感、也是最核心的行业性难题。不只是音乐,所有涉及AI辅助内容创作的领域都在探讨这个问题。音乐涉及词、曲、编曲、演唱等多个可变的环节,每个环节的微小调整都会影响最终作品的听感和风格,这种组合的灵活性使得其版权界定异常困难。如果通过AI低成本“洗盗蹭”或者靠打版权保护擦边球的AI热歌能获得巨大收益,那会导致创作者激励崩塌,造成劣币驱逐良币,侵蚀对原创保护的根基。现有法律制度在应对这种新技术催生的隐蔽侵权模式时,面临巨大挑战,举证和认定极为困难。平台有责任和义务,采取更严格的管理机制,保护优质作品,给用户更好的内容。行业亟需更清晰的规则和具有标杆意义的司法案例来确立边界,遏制这种通过技术手段“搭便车”、损害行业长期生态的行为。六、2025,出现了许多AI音乐歌手,引发了行业关注和热议。您如何看待AI歌手的核心竞争力?他们能否像初音未来等虚拟歌手一样成为虚拟偶像?李玲玲:AI歌手和虚拟歌手本质上是虚拟人形式在音乐领域的应用,这并不是全新事物。这次的不同在于,AI首先让歌曲创作本身变得成熟,“歌红人不红”成为一个新现象。要想形成持久的生态和IP,歌曲背后仍然需要人格化的形象和故事支撑。因此,当AI音乐创作相对成熟后,打造虚拟歌手是一个趋势。同时,也必须认识到,虚拟歌手本身更像一个前端的符号或工具,其核心竞争力并不在于“虚拟”,而在于背后真人团队的操盘能力。团队需要为其建立人设、创作内容、策划与粉丝的情感连接和互动方式,才能培育成虚拟偶像。这与培养一个真人艺人的逻辑是相似的,背后最重要的依然是人的创意和运营。近期一个比较成功的案例是虚拟歌手“大头针Official”,他凭借独特的“苦情嗓”演绎经典老歌,已经进入了头部虚拟艺人的行列。打造这样的角色,关键在于声音特色的选择、与歌曲的匹配,以及持续的运营,这背后是大量的技术和人力工作。七、在AI量产能力如此强大的情况下,是否会导致套路化的“口水歌”越来越多?整个音乐审美和产业生态,如果实现精品化和突破创新?李玲玲:这个问题需要从两个层面来看:功能性音乐和消费性平台音乐。对于功能性音乐,比如游戏、影视、短剧配乐,AI带来的影响是积极且个性化的。以前需要提前定制,现在可以根据剧情或玩家场景即时生成,极大地提高了生产效率,并实现了真正的场景化、个性化适配。我们正在探索将AI生成音乐的能力嵌入游戏的合作,这就是一个正向的改变。对于平台上的消费性音乐,同质化的问题在有AI之前就已存在,这是市场流量导向和短视频等影响音乐传播所致。但值得注意的是,AI并非只能加剧同质化。以我们的虚拟歌手“大头针Official”为例,他那种用撕裂的男声演绎温柔老歌的风格,正是AI带来的、超越真人音域和常规想象的惊喜。这种独特的艺术表达,如果没有AI,可能很难被创造出来。所以,要看到顶尖的音乐模型已经开始能够产生突破性的惊喜。更重要的是,AI模型是可调校的。一个优秀作品的背后,往往是创作者投入大量精力,通过无数次提示和筛选才实现的,这本身就需要很高的人力审美和判断。如果完全不做干预,让AI自动生成,那结果确实可能流于平庸。因此,技术本身不是限制。最终是走向精品还是同质,取决于背后的“人”——创作者如何使用工具、市场如何选择,以及模型在迭代中能否持续突破。对于消费端而言,个性化无疑是一个确定的方向。实际上,基于算法的个性化推荐已经让音乐分发越来越个性化,流量不再那么集中于头部。而GenAI技术的成熟,将把个性化推向新的高度——场景化与实时生成。未来,随着智能手表、眼镜等新硬件的普及,音乐服务将深度融入各种生活场景,为用户生成或推荐贴合其当下状态的音乐。目前,这部分主要还是推荐式的,即从已有曲库中匹配。但我们已经开始探索更前沿的生成式个性化,即根据实时数据动态生成独一无二的音乐片段。这将是未来拓展流量场景、实现深度个性化的重要方向。没有人类参与的AI音乐才会趋于平庸,AI只是打开了一扇通向新可能性的大门。