NextFin 新闻——2025 年 12 月 15 日,总部位于柏林的初创公司 Mirelo 宣布完成 4100 万美元的种子轮融资。Mirelo 由前亚马逊人工智能研究员 CJ Simon-Gabriel 和 Florian Wenzel 于 2023 年创立。本轮融资由 Index Ventures 和 Andreessen Horowitz 两家知名风险投资公司共同领投,Atlantic.vc 和 TriplePoint Capital 也参与了投资。此次融资是迄今为止欧洲人工智能音频领域规模最大的早期投资之一,凸显了机构投资者对音频作为生成媒体下一个前沿领域的日益增长的信心。
Mirelo 的平台独辟蹊径,解决了人工智能驱动的视频内容创作中一个普遍存在却鲜少被重视的问题:缺乏同步音轨和音效,或者同步音轨和音效质量低下。尽管生成式人工智能在即时生成文本和视觉内容方面取得了长足进步,但用户在手动制作与视频动态相匹配的真实音乐和音效时仍然面临着巨大的瓶颈。Mirelo 采用专有的基础模型,旨在生成与视觉运动、情绪和节奏完美契合的音轨,其计算能力比典型的大型语言模型最多可节省 50 倍。其旗舰版本 Mirelo SFX v1.5 能够通过 Web 应用和开发者 API 以超实时的速度生成各种音频变体。
鉴于声音对观众参与度和内容共鸣的显著影响,这一进展尤为重要。长期以来,视频制作一直将声音视为辅助元素,通常需要手动同步和成本高昂的后期制作流程。Mirelo 旨在普及高质量音频生成,使电影、视频游戏、社交媒体和 AR/VR 环境中的业余创作者和专业人士都能在不牺牲情感深度或沉浸感的前提下,扩展制作规模。
这家公司的两位创始人都是从音乐家转型为人工智能研究员的,他们强调公司的使命是成为所有视觉媒体的“音频层”。他们的技术不仅解决了同步难题,还能理解场景的上下文——解读情感线索,从而生成增强叙事效果的声音。Mirelo 的方法与主要专注于语音或独立音乐生成的竞争对手截然不同,它能够提供与视频相匹配、更具真实感的音效。
从市场角度来看,Mirelo 的崛起与生成式人工智能内容行业的快速扩张相吻合,预计到 2028 年,该行业的规模将超过 500 亿美元。音频部分通常被边缘化,但它代表着 Mirelo 及其同行正在努力挖掘的巨大潜力。知名风险投资公司的投资表明,市场预期 Mirelo 将实现强劲增长,而推动这一增长的动力来自于对可扩展、可定制的内容创作工具日益增长的需求,这些工具能够缩短产品上市时间并降低制作成本。
此外,Mirelo 的模型效率是一项关键的竞争优势。降低计算强度不仅可以减少运营成本,还能在云端和边缘环境中实现实际部署,从而便于集成到自适应游戏音效和实时增强现实音频体验等交互式场景中。这种对可扩展性和响应速度的重视,与行业对以用户为中心的动态媒体体验的需求趋势相契合。
展望未来,Mirelo计划加大研发投入,并与游戏工作室、电影制作公司和社交媒体平台建立战略合作伙伴关系,将其音频生成技术更深入地融入到创意流程中。这一前瞻性举措凸显了向整体式多媒体人工智能架构的转变,在该架构中,视觉和听觉元素将通过先进的人工智能模型进行有机融合。
在现任美国总统唐纳德·特朗普的领导下,监管环境对人工智能创新持谨慎支持态度,强调竞争力,同时也关注人工智能的伦理使用。Mirelo 的技术以创造性增强为核心,避免自主决策的风险,这与这些政策立场高度契合,并有望受益于扶持人工智能初创企业的各项举措。
总之,Mirelo 的融资里程碑和技术进步标志着生成媒体发展的一个重要里程碑,它将声音定位为核心组成部分,而非事后添加。这一领域的成功有望推动人工智能生成的视听内容在娱乐、广告、教育和新兴元宇宙应用等领域的更广泛应用,并为沉浸式数字体验树立新的标杆。
据 TechCrunch 报道,Mirelo 将人工智能驱动的声音生成和视频同步创新性地融合在一起,预示着一种范式转变,有望解决生成式人工智能最持久的创意挑战之一。
Explore more exclusive insights at nextfin.ai.