音乐界Deepseek时刻已来昆仑万维发布引入CoT的音乐模型Mureka O1

发布时间：2025-03-27 01:35:40 浏览量：41

德银分析师马克·安德里森将DeepSeek的发布称为“中国的斯普特尼克时刻”，标志着中国AI科技的崛起。

如今，AI音乐界迎来了属于自己的“DeepSeek时刻”——3月26日，来自中国的AI科技公司昆仑万维正式发布全球首个引入CoT（ChAIn of Thought）技术的音乐推理模型Mureka O1。

作为业内首款将多步逻辑推理与音乐创作深度融合的模型，Mureka O1不仅在技术架构上颠覆传统生成范式，更在与Suno V4等主流模型的客观评测中全面领先。昆仑万维通过CoT技术实现了从“音符堆砌”到“逻辑化创作”的跨越，重新定义AI音乐的可能性。

2024年4月，昆仑万维发布了基于“天工3.0”打造的第一代音乐生成模型Mureka V1（SkyMusic）。这款音乐大模型在人声&BGM音质、人声自然度、发音可懂度等性能方面，以6.65分的综合得分超越Suno V3，成为中国首个音乐AIGC SOTA模型。

经过一年的升级迭代，昆仑万维发布了全新的基座音乐模型Mureka V6，此款模型引入了昆仑万维自研ICL（in-context learning）技术，使得声场更加开阔，人声质感和混音设计进一步强化，相比此前更新的Mureka V5.5版本，歌曲品质进一步增强，支持纯音乐生成和十种语言的歌曲生成。

值得关注的是，与Mureka V6同步发布的全球首个采用CoT技术音乐推理模型Mureka O1。

Mureka O1中包含了Mureka团队最新发布的音乐生成领域创新研究成果——MusiCoT。MusiCoT的独特之处在于，其利用了思维链方法，不同于传统自回归模型逐步生成音频，通过逐步反馈与优化机制，显著提升了歌词旋律契合度、演唱准确性和艺术表现力，同时保持了低延时音乐生成。大幅提升了生成音乐的结构连贯性与乐器编排精准度。

此外，MusiCoT基于CLAP模型，不需要人工标注即可具备高扩展性，可以显著提高生成音乐的可解释性和质量。

简单而言，Mureka O1是基于Mureka V6的推理优化版本，也是全球范围内首个引入CoT的音乐模型，O1模型会在音乐生成过程中加入思考与自我批判，提升音乐品质，以颠覆性的水平重新定义了AI音乐。

用户打开Mureka官网www.mureka.ai，即可体验音乐生成与创作，还可以随时切换想使用的模型版本。

模型版本切换

此次发布的Mureka V6音乐模型可支持包含“中英葡西日韩德法俄意”在内的10种主流语言的歌词与音乐生成，涵盖多种风格与流派，可以满足全球大多数国家的用户需求。

支持10种语言

无论是Mureka V6还是O1，支持20余种创作曲风，包括爵士/Jazz、电子/electronic、流行/pop、乡村country、R&B、soul、blues、摇滚/rock、舞曲/dance等，涵盖快乐、放纵、神秘、充满活力、悲伤等情绪，用户可用Mureka尽兴表达个人的喜怒哀乐。

Mureka还拥有两个独特的音乐生成功能。首先，一改过去写Prompt的方式，Mureka可直接将音乐本身作为提示，用户可上传音频或Youtube链接作为创作提示，这是一种比文本提示更直接更高级的提示方式；其次，音色克隆，Mureka是全球首个可以指定演唱歌手音色的AI音乐生成平台，用户不仅可以选择官方提供的多种歌手音色，还可以上传自己的声音，让AI学习并复刻，精准模拟歌手音色，一键生成个性化专属作品,人人都可以成为AI歌手。

此外，在创作中，只要输入场景描述性的Prompt，即可生成与特定场景完美契合的完整背景音乐。Mureka V6音乐模型还可实现独立的人声、伴奏等多轨分离下载，方便用户后续混音与二次创作。

通过实际测试，Mureka V6在发音唱对率、乐段准确率、文本相关度、制作质量等客观指标中大幅优于Suno V4。Mureka O1在发音清晰程度、生成乐段的精准度上遥遥领先。

图丨Mureka O1在文本生成音乐的客观测评中得分

此外，通过AI基础设施深度优化，Mureka O1实现了行业领先的低延迟音乐生成，提供即时、高质量的用户体验。

图丨Mureka O1实现了行业领先的低延时音乐生成

值得一提的是，为了方便专业的音乐创作者提升创作效率，昆仑万维开放了Mureka V6 API和模型微调API。开发者可以直接调用Mureka的API生成歌曲，同时可以上传自己的私有数据微调模型，让模型生成符合数据特征风格的歌曲，这对于B端企业而言无疑能够使用API定制化制作想要的音乐，且能大幅降低音乐制作成本。

根据全球市场调查机构财富商业洞察力（Fortune Business Insights）的数据显示，2023年全球数字音频工作站（DAW, Digital Audio Workstation）市场规模高达约30亿美元，预计2026年约70%的DAW企业将使用AI技术辅助音乐创作。

昆仑万维Mureka O1的发布不仅是昆仑万维技术实力的集中展现，更标志着AI音乐从“模仿”迈向“思考”的新纪元。当逻辑链渗入每一个音符，音乐创作的边界正在被无限拓宽。AI音乐的“DeepSeek时刻”已经到来。截至目前，Mureka已经吸引了全球范围内超过100个国家和地区的用户访问。

本质上，昆仑万维看中的不仅仅是前景广阔的AI音乐市场，也是为了完成其AIGC布局中的重要一环。

自2020年开始布局AIGC和大模型领域，目前昆仑万维拥有五大自研模型（文本大模型、图文大模型、3D大模型、视频大模型、音乐大模型）。依托“天工大模型”这一技术基石，昆仑万维已规划出包含AI大模型、AI音乐、AI 社交、AI短剧等在内的AI业务矩阵，并着力整合几大板块，构筑一个集成式的AI UGC平台，让人人都能用AI表达自我。

正如昆仑万维创始人周亚辉所说：“未来30年是自我表达的30年，我们要用AI把人类创作的门槛降得足够低，让人们更充分地实现自我表达。”