音乐界Deepseek时刻已来 昆仑万维发布引入CoT的音乐模型Mureka O1
更新时间:2025-03-27 01:35 浏览量:7
德银分析师马克·安德里森将DeepSeek的发布称为“中国的斯普特尼克时刻”,标志着中国AI科技的崛起。
如今,AI音乐界迎来了属于自己的“DeepSeek时刻”——3月26日,来自中国的AI科技公司昆仑万维正式发布全球首个引入CoT(ChAIn of Thought)技术的音乐推理模型Mureka O1。
作为业内首款将多步逻辑推理与音乐创作深度融合的模型,Mureka O1不仅在技术架构上颠覆传统生成范式,更在与Suno V4等主流模型的客观评测中全面领先。昆仑万维通过CoT技术实现了从“音符堆砌”到“逻辑化创作”的跨越,重新定义AI音乐的可能性。
2024年4月,昆仑万维发布了基于“天工3.0”打造的第一代音乐生成模型Mureka V1(SkyMusic)。这款音乐大模型在人声&BGM音质、人声自然度、发音可懂度等性能方面,以6.65分的综合得分超越Suno V3,成为中国首个音乐AIGC SOTA模型。
经过一年的升级迭代,昆仑万维发布了全新的基座音乐模型Mureka V6,此款模型引入了昆仑万维自研ICL(in-context learning)技术,使得声场更加开阔,人声质感和混音设计进一步强化,相比此前更新的Mureka V5.5版本,歌曲品质进一步增强,支持纯音乐生成和十种语言的歌曲生成。
值得关注的是,与Mureka V6同步发布的全球首个采用CoT技术音乐推理模型Mureka O1。
Mureka O1中包含了Mureka团队最新发布的音乐生成领域创新研究成果——MusiCoT。MusiCoT的独特之处在于,其利用了思维链方法,不同于传统自回归模型逐步生成音频,通过逐步反馈与优化机制,显著提升了歌词旋律契合度、演唱准确性和艺术表现力,同时保持了低延时音乐生成。大幅提升了生成音乐的结构连贯性与乐器编排精准度。
此外,MusiCoT基于CLAP模型,不需要人工标注即可具备高扩展性,可以显著提高生成音乐的可解释性和质量。
简单而言,Mureka O1是基于Mureka V6的推理优化版本,也是全球范围内首个引入CoT的音乐模型,O1模型会在音乐生成过程中加入思考与自我批判,提升音乐品质,以颠覆性的水平重新定义了AI音乐。
用户打开Mureka官网www.mureka.ai,即可体验音乐生成与创作,还可以随时切换想使用的模型版本。
模型版本切换
此次发布的Mureka V6音乐模型可支持包含“中英葡西日韩德法俄意”在内的10种主流语言的歌词与音乐生成,涵盖多种风格与流派,可以满足全球大多数国家的用户需求。
支持10种语言
无论是Mureka V6还是O1,支持20余种创作曲风,包括爵士/Jazz、电子/electronic、流行/pop、乡村country、R&B、soul、blues、摇滚/rock、舞曲/dance等,涵盖快乐、放纵、神秘、充满活力、悲伤等情绪,用户可用Mureka尽兴表达个人的喜怒哀乐。
Mureka还拥有两个独特的音乐生成功能。首先,一改过去写Prompt的方式,Mureka可直接将音乐本身作为提示,用户可上传音频或Youtube链接作为创作提示,这是一种比文本提示更直接更高级的提示方式;其次,音色克隆,Mureka是全球首个可以指定演唱歌手音色的AI音乐生成平台,用户不仅可以选择官方提供的多种歌手音色,还可以上传自己的声音,让AI学习并复刻,精准模拟歌手音色,一键生成个性化专属作品,人人都可以成为AI歌手。
此外,在创作中,只要输入场景描述性的Prompt,即可生成与特定场景完美契合的完整背景音乐。Mureka V6音乐模型还可实现独立的人声、伴奏等多轨分离下载,方便用户后续混音与二次创作。
通过实际测试,Mureka V6在发音唱对率、乐段准确率、文本相关度、制作质量等客观指标中大幅优于Suno V4。Mureka O1在发音清晰程度、生成乐段的精准度上遥遥领先。
图丨Mureka O1在文本生成音乐的客观测评中得分
此外,通过AI基础设施深度优化,Mureka O1实现了行业领先的低延迟音乐生成,提供即时、高质量的用户体验。
图丨Mureka O1实现了行业领先的低延时音乐生成
值得一提的是,为了方便专业的音乐创作者提升创作效率,昆仑万维开放了Mureka V6 API和模型微调API。开发者可以直接调用Mureka的API生成歌曲,同时可以上传自己的私有数据微调模型,让模型生成符合数据特征风格的歌曲,这对于B端企业而言无疑能够使用API定制化制作想要的音乐,且能大幅降低音乐制作成本。
根据全球市场调查机构财富商业洞察力(Fortune Business Insights)的数据显示,2023年全球数字音频工作站(DAW, Digital Audio Workstation)市场规模高达约30亿美元,预计2026年约70%的DAW企业将使用AI技术辅助音乐创作。
昆仑万维Mureka O1的发布不仅是昆仑万维技术实力的集中展现,更标志着AI音乐从“模仿”迈向“思考”的新纪元。当逻辑链渗入每一个音符,音乐创作的边界正在被无限拓宽。AI音乐的“DeepSeek时刻”已经到来。截至目前,Mureka已经吸引了全球范围内超过100个国家和地区的用户访问。
本质上,昆仑万维看中的不仅仅是前景广阔的AI音乐市场,也是为了完成其AIGC布局中的重要一环。
自2020年开始布局AIGC和大模型领域,目前昆仑万维拥有五大自研模型(文本大模型、图文大模型、3D大模型、视频大模型、音乐大模型)。依托“天工大模型”这一技术基石,昆仑万维已规划出包含AI大模型、AI音乐、AI 社交、AI短剧等在内的AI业务矩阵,并着力整合几大板块,构筑一个集成式的AI UGC平台,让人人都能用AI表达自我。
正如昆仑万维创始人周亚辉所说:“未来30年是自我表达的30年,我们要用AI把人类创作的门槛降得足够低,让人们更充分地实现自我表达。”