没有人类参与的AI音乐才会趋于平庸｜破晓访谈

发布时间：2026-01-23 20:15:20 浏览量：92

生成式人工智能（GenAI）引爆了一场深刻的生产力范式革命。在文化产业领域，既有的内容创作、价值生成、商业模式与消费形态等正面临着全面重塑，引发全行业对未来的深刻追问。腾讯研究院与中国传媒大学文化产业管理学院合作推进《GenAI重塑文化产业》研究项目，聚焦GenAI在长视频、短视频、音乐、动画、网络文学等重点领域的应用，分析多领域产品、产线、管线的变化趋势，探索文化产业智能化发展路径。期望汇聚技术涌现的“智能之光”与人类永恒的“智慧之光”，迎接文化产业变革时刻。继前四期专题访谈之后，本期我们聚焦腾讯音乐娱乐集团（以下简称TME），与腾讯音乐曲库版权高级总监，酷狗内容运营总监兼启明星AI音乐项目负责人李玲玲，共话音乐产业在GenAI时代的技术变革、模式创新、版权困局与创新突破。

本期嘉宾：李玲玲腾讯音乐曲库版权高级总监&酷狗内容运营总监，启明星AI音乐项目负责人课题组：中国传媒大学文化产业管理学院：刘江红、田卉、陈娴颖、李苏怡腾讯研究院：孙怡、田小军、冯宏声等

【观点速览】

1. GenAI对于音乐产业的核心价值：极大提升创作效率，在作词、成曲、演唱等环节均有应用。随着音乐大模型的迭代优化，AI音乐生成的整体质量不断提高。现阶段AI音乐创作或辅助人类创作主要是模仿，如果能够形成一个“生产-消费-反馈”的闭环，AI具有在模仿基础上形成新的音乐形式和流派的潜力。

2.音乐领域的“超级个体”现象十分凸显，主要赋能独立音乐人和普通用户。独立音乐人从“部分环节创作者”变为能独立操盘全流程的个体。普通用户实现从“消费者”到“创作者”的身份跃迁。当音乐创作门槛被AI大幅降低后，除了审美和创作能力，操盘能力和运营能力将变得至关重要。

3.GenAI是一把双刃剑，既释放生产力，也对平台的内容管理能力和行业的版权保护构成了巨大挑战。最终解决版权这一核心难题，需要法律、制度和整个行业形成有效共识，共同建立清晰的规则。

4.在功能性音乐中，AI已能全自动生成免费或极低成本的场景化音乐，带来积极变革；在消费性音乐中，投入了高审美和大量创意的创作者能利用AI生产突破性精品。探索“AI原生音乐”，创造人类无法实现的全新艺术表达，才是AI带来的创新增量。AI将把音乐推荐从“个性化”推向“场景化与实时生成”，未来趋势是基于实时数据和生活场景，生成符合用户需求、独一无二的音乐，这是深度个性化的核心方向。

访谈内容分享：一、目前GenAI在音乐产业的具体工作流程中，是如何体现降本增效的？主要集中在哪些环节？未来AI生成的音乐，有没有可能创造出目前人类创作音乐中没有的全新风格？李玲玲：GenAI带来的根本性改变，在于极大地提升了创作者端的生产效率，这半年来的进步尤为显著。半年前，AI在音乐创作中的应用还局限于作词、编曲、乐器适配等单一环节。但随着Suno等国内外大模型的崛起，AI在整体音乐生产上的能力有了巨大飞跃，产出的质量已经相当不错。从平台供给侧来看，独立音乐人的内容供给量已经达到了原来的2到3倍。其次是厂牌，他们背后有自己的工业化生产链路，所以效率提升虽然没有达到独立音乐人的几何级增长，但也有大幅提升。目前来看，真正高质量的AI音乐作品比例还不高。我们对AI内容的审核和管理标准实际上更严格，特别是对于可能涉及“洗盗蹭”的内容，会采取更严格的控制措施，以保护原创生态。从AI参与的环节看，首先是作词，其次是直接成曲。创作者使用AI编曲辅助工具也很常见。最后是演唱环节，换音的应用也比较多，用户可以用模型将自己的声音替换成其他音色进行演绎。腾讯音乐也有自研的音乐大模型，比如“文曲”专注于作词，领先行业声音演唱模型。对于AI能否创造出不同于人类创作的全新音乐？虽然现阶段主要是模仿，但我个人观点，未来这是有可能的。这其中的关键在于，AI拥有庞大的数据学习能力，并且如果能够形成一个“生产-消费-反馈”的闭环，它就有潜力在模仿的基础上找到创新突破点。这也是TME未来要重点发展自研大模型的优势所在，我们可以让AI生成的内容直接在用户端接受检验，收集消费数据和反馈，再将这些反馈用于迭代和优化模型。通过分析哪些内容能引发惊喜或突破，可以引导AI探索新的创作方向。二、生产效率提高后，音乐领域的“超级个体”现象是否更加凸显了？您认为他们具备哪些独特的核心优势和竞争力？李玲玲：是的，非常明显。我们可以把从业者大致分为三类：第一类是有完整团队支持的顶尖创作者；第二类是独立音乐人，自己负责创作、发行和宣传；第三类就是广大的听歌用户。在第二类当中，他们拥有很好的审美和市场嗅觉，比如制作人，但在GenAI出现之前自己不会写词、作曲或演唱。现在，借助AI工具完全可以独立操盘全流程，从创意沟通、打造歌曲到负责宣推，不再必须依赖特定的词曲作者或歌手。更大的变化发生在第三类人，即普通用户身上。他们可能只是音乐爱好者，缺乏专业知识和专业训练，但AI工具和一站式发布平台，让他们也能创作、发布甚至打榜。这种从“消费者”到“创作者”的身份转换，未来还有巨大的创新空间。我认为音乐领域的“超级个体”最重要的能力将集中在三个方面。第一是高级审美能力，对音乐有深刻的理解和品位。第二是AI调教与对话能力，懂得如何与AI模型有效沟通，引导其产出符合想法的作品。第三是情感与内容表达力。最终作品能否打动人，取决于创作者注入的情感深度和叙事能力。这要求创作者不仅要有理性（懂技术），更要有丰富的感性。因此，未来的音乐人需要的是更综合、更偏向创意与审美层面的素质。三、从结构来看，您认为这三类人会呈现怎样的形态，是“金字塔型”还是“橄榄型”？比如中间层的创作者数量急剧扩大，但头部顶尖创作者依然稳固？李玲玲：从大的结构上看，我倾向于是“橄榄型”。顶尖的创作者有其不可替代性，他们不仅拥有顶级的创作力，更有强大的粉丝基础和与用户的情感连接，这种地位短期内很难被AI动摇。但音乐行业和网文、短视频等领域面临一个共同的新现实：创作本身，因为AI的赋能已经不再是核心门槛了，发行和获取关注正成为新的、更大的门槛。用户的总时间和注意力是有限的，是一个几乎恒定的“流量池”。然而，内容供给却在爆炸式增长。在如此海量的新作品中，如何脱颖而出？因此，对创作者的要求发生了根本变化。除了审美和创作能力，操盘能力和运营能力将变得至关重要。一个创作者如果只会创作，但不懂如何经营自己、推广作品，很可能依然无法获得成功。所以从长期看，即便创作水平普遍提高，更多人进入“橄榄型”的中部，但决定其商业价值和影响力的关键，可能越来越取决于创作之外的运营能力。四、GenAI带来音乐作品海量增长，这是否给平台的音乐审核、分发和运营带来更大的压力？李玲玲：作为平台曲库与内容的直接管理者，我们面临的压力确实非常大。首先，从国家监管要求出发，必须对海量内容进行有效识别和审核。当前，完全自动化的审核技术还不够成熟，我们需要技术判断与人工审核双管齐下。其次，AI参与创作的环节非常复杂，涉及作词、作曲、生成、演唱等多个维度。为此，我们去年最重要的工作之一就是建立一套针对AI内容的管理标准体系。这包括制定详细的审核规范、开发反向识别算法，以及建立“算法初步识别 → 人工审核判断 → 算法持续优化”的闭环流程。再者，我们还要积极制定并推行面向创作者的规范，鼓励他们主动声明AI使用情况，并与厂牌等合作伙伴共同管理 AI作品的元数据、推动行业 AI 工具使用的标准规范。李玲玲：我们目前探索的授权合作，主要围绕具体的、可受版权保护的内容展开，一种是基于词曲的改编授权。我们会与词曲作者或代理公司洽谈，获取其作品的AI改编授权。允许用户基于原词曲进行二创，由此产生的收益会通过协议分享给原作者。这是一种新的宣发模式，能快速提升歌曲的传播度和互动性。不过，词曲作者对此仍比较谨慎，主要担心滥用和收益追溯问题。我们会通过活动授权、明确周期、建立完整收益追溯机制等方式来推进。另一种是歌手音色授权。歌手的音色是其最核心的资产，通常非常慎重，极少开放授权。我们接触到的案例，更多是“辅助性”或“延续性”的。例如，大家都知道，TME曾与王力宏合作，授权我们使用AI技术辅助制作专辑，以“AI王力宏”的形式传播，但作品仍完全归属于他。这都是获得本人明确授权后，用于服务其自身艺术发展的。另一方面，版权保护和管理也是当前最敏感、也是最核心的行业性难题。不只是音乐，所有涉及AI辅助内容创作的领域都在探讨这个问题。音乐涉及词、曲、编曲、演唱等多个可变的环节，每个环节的微小调整都会影响最终作品的听感和风格，这种组合的灵活性使得其版权界定异常困难。如果通过AI低成本“洗盗蹭”或者靠打版权保护擦边球的AI热歌能获得巨大收益，那会导致创作者激励崩塌，造成劣币驱逐良币，侵蚀对原创保护的根基。现有法律制度在应对这种新技术催生的隐蔽侵权模式时，面临巨大挑战，举证和认定极为困难。平台有责任和义务，采取更严格的管理机制，保护优质作品，给用户更好的内容。行业亟需更清晰的规则和具有标杆意义的司法案例来确立边界，遏制这种通过技术手段“搭便车”、损害行业长期生态的行为。六、2025，出现了许多AI音乐歌手，引发了行业关注和热议。您如何看待AI歌手的核心竞争力？他们能否像初音未来等虚拟歌手一样成为虚拟偶像？李玲玲：AI歌手和虚拟歌手本质上是虚拟人形式在音乐领域的应用，这并不是全新事物。这次的不同在于，AI首先让歌曲创作本身变得成熟，“歌红人不红”成为一个新现象。要想形成持久的生态和IP，歌曲背后仍然需要人格化的形象和故事支撑。因此，当AI音乐创作相对成熟后，打造虚拟歌手是一个趋势。同时，也必须认识到，虚拟歌手本身更像一个前端的符号或工具，其核心竞争力并不在于“虚拟”，而在于背后真人团队的操盘能力。团队需要为其建立人设、创作内容、策划与粉丝的情感连接和互动方式，才能培育成虚拟偶像。这与培养一个真人艺人的逻辑是相似的，背后最重要的依然是人的创意和运营。近期一个比较成功的案例是虚拟歌手“大头针Official”，他凭借独特的“苦情嗓”演绎经典老歌，已经进入了头部虚拟艺人的行列。打造这样的角色，关键在于声音特色的选择、与歌曲的匹配，以及持续的运营，这背后是大量的技术和人力工作。七、在AI量产能力如此强大的情况下，是否会导致套路化的“口水歌”越来越多？整个音乐审美和产业生态，如果实现精品化和突破创新？李玲玲：这个问题需要从两个层面来看：功能性音乐和消费性平台音乐。对于功能性音乐，比如游戏、影视、短剧配乐，AI带来的影响是积极且个性化的。以前需要提前定制，现在可以根据剧情或玩家场景即时生成，极大地提高了生产效率，并实现了真正的场景化、个性化适配。我们正在探索将AI生成音乐的能力嵌入游戏的合作，这就是一个正向的改变。对于平台上的消费性音乐，同质化的问题在有AI之前就已存在，这是市场流量导向和短视频等影响音乐传播所致。但值得注意的是，AI并非只能加剧同质化。以我们的虚拟歌手“大头针Official”为例，他那种用撕裂的男声演绎温柔老歌的风格，正是AI带来的、超越真人音域和常规想象的惊喜。这种独特的艺术表达，如果没有AI，可能很难被创造出来。所以，要看到顶尖的音乐模型已经开始能够产生突破性的惊喜。更重要的是，AI模型是可调校的。一个优秀作品的背后，往往是创作者投入大量精力，通过无数次提示和筛选才实现的，这本身就需要很高的人力审美和判断。如果完全不做干预，让AI自动生成，那结果确实可能流于平庸。因此，技术本身不是限制。最终是走向精品还是同质，取决于背后的“人”——创作者如何使用工具、市场如何选择，以及模型在迭代中能否持续突破。对于消费端而言，个性化无疑是一个确定的方向。实际上，基于算法的个性化推荐已经让音乐分发越来越个性化，流量不再那么集中于头部。而GenAI技术的成熟，将把个性化推向新的高度——场景化与实时生成。未来，随着智能手表、眼镜等新硬件的普及，音乐服务将深度融入各种生活场景，为用户生成或推荐贴合其当下状态的音乐。目前，这部分主要还是推荐式的，即从已有曲库中匹配。但我们已经开始探索更前沿的生成式个性化，即根据实时数据动态生成独一无二的音乐片段。这将是未来拓展流量场景、实现深度个性化的重要方向。没有人类参与的AI音乐才会趋于平庸，AI只是打开了一扇通向新可能性的大门。

没有人类参与的AI音乐才会趋于平庸｜破晓访谈

相似文章