快捷导航
Quick Navigation
联系我们
字节海外竞对:停更一年半躺赔50万逆袭估值5亿
2021 岁首年月,两个年轻人花了两天时间做了一个从动字幕 App。上线没几天,它就冲上了 App Store 排行榜榜首。听起来是个好的起头。但这两小我感觉字幕东西太“小”了,不敷,于是回头去做了一个照片分享使用,想抓住Instagram 从照片转向视频时留下的空白。照片 App 确实拿到了五六万日活用户,也成功完成了 A 轮融资。而阿谁字幕 App 被他们扔正在了付费墙后面,停了,停了更新,完全遗忘了。创始人 Gaurav Misra 的小我苹果账户里堆了几千封用户客服邮件,一封都没读。一年半之后,他们偶尔打开后台,发觉了一件离谱的事:这个没人管的 App,本人长到了 50 万用户,赔了 50 万美元。正在 AI 视频赛道合作最激烈的 2026 年,Mirage 走了一条很出格的。它既没有像 Runway 那样对准片子级的视频生成,也没有像 Synthesia 那样全力押注企业数字人培训。它死磕的是一件更公共的事:让通俗人和小团队也能快速做出都雅的短视频。带着 a16z、红杉、Kleiner Perkins、Index Ventures 这些机构给的钱,和跨越 2000 万全球用户,这家公司正试图证明,AI 视频赛道里最大的机遇,可能藏正在最日常的场景里。Mirage的转型,是AI时代,AI视频公司一个很是典型的样本。L2F光源创业者基金投资总监Lela一曲正在一线稠密看很多AI视频的项目,她告诉虎嗅,视频模子群雄逐鹿,国表里均有几十亿美金的创业公司,大模子公司和大厂也均有结构,使用公司的突围体例更多要回归创做本身。正在前几年,创业公司会更多聚焦正在单点功能和交互体例的立异上,好比captions的字幕,对口型,虚拟抽象;还有typenow从推的画布交互,出发的基点都是创做者正在ai时代取agent发生的新交互。跟着模子能力的提拔,模子端到端完成使命的能力趋强,创做者的也正在改变,交互将会变得更为简单,底层的工程框架和创做者knowhow/skill的堆集会成为新一代视频agent的焦点资产,市场会一曲处海形态,新的10亿美金公司仍会发生,对于创业公司来说只要变化是不变的。Lela的话,他们恰是从Captions起身,敏捷跑起来,然后再Pivot(转型)最初成为一个让AI端到端完成从素材到成片的工做流的平台。Captions 最早能跑起来,靠的是一个出格朴实的洞察:人们越来越多地正在无声形态下刷短视频。地铁上、办公室里、深夜躺正在床上,手机静音是常态。TikTok、Instagram Reels、YouTube Shorts 上的内容,有很大比例是正在没有声音的环境下被消费的。a16z 正在投资 Captions 时就特地提到了这一点:无声旁不雅让字幕和文字笼盖变成了短视频的刚需,而其时市道上的字幕东西要么太粗拙,要么太贵。Captions 做的工作很简单:给视频从动加字幕,支撑 100 多种言语,还能自定义字体、颜色、动画结果。就这么一个看起来不起眼的功能,上线 万日活用户。2023 年起头,Captions 进入了功能迸发期。它推出了 AI 口型同步配音(Lipdub),能把视频里的语音翻译成 28 种言语,同时让措辞人的嘴型和翻译后的语音婚配上。2025 年的新版音频模子以至能保留措辞者本来的口音特征,这外行业里很领先。紧接着是 AI 虚拟抽象(AI Creator),号称全球第一个专为内容创做设想的 3D 数字人,用户不消实人出镜就能生成逼实的视频。然后是 AI 一键编纂,系统从动给视频加转场、插入 B-roll 素材、配音乐和音效,供给 21 种以上的预设气概。还有 AI 眼神矫正,让措辞的人看起来一直正在镜头。这些功能单拎出来看都挺厉害,但 Captions 把它们全数塞进了统一个 App 里。一个从没剪过视频的通俗人,打开Captions,录一段话,点几下,就能拿到一条看起来像专业团队产出的短视频。此次更名背后有很明白的信号。创始人 Gaurav Misra 正在声明里说:「正在我们看来,AI 视频的实正竞赛还没有起头。Mirage 这个名字代表了我们更大的愿景——通过前沿 AI 研究和模子,从短视频起头,从头定义视频这个品类。」更名之后的架构是如许的:Mirage 做为母公司品牌,旗下保留 Captions(消费者创做使用)和新斥地的 Mirage Studio(面向品牌和营销团队的企业平台)。更焦点的变化正在手艺层。公司从头锻炼了本人的根本模子,包罗 Mirage Video(音频到视频的生成模子)和 Mirage Audio(可控的表示力音频生成模子)。这两个模子的出格之处正在于,它们是特地为短视频场景设想的。保守的 AI 视频模子逃求的是通用的画面生成能力,但Mirage 的模子关心的是短视频里最焦点的三个变量:节拍、构图和留意力动态。简单说,就是什么时候切画面、画面怎样摆、怎样正在前几秒抓住不雅众的留意力。这些工具对专业剪辑师来说曲直觉,Mirage 要做的是把这种曲觉变成模子能力,让 AI 替你做出这些判断。Mirage 把这种方式叫做“Assembly Intelligence(拆卸智能)”,别离担任节拍、构图、留意力和音频,最初输出一条完整的视频。正在赔本这件事上,Mirage 用的是订阅制加积分制的组合。免费版供给根本功能,Pro 版每月 9。99 美元(200 积分),Max 版 24。99 美元(500 积分),Scale 版 69。99 美元(1400 积分),企业版定制价钱。AI 功能按积分耗损,好比用 AI 生成视频按秒计费,用对话式编纂按动静计费。这种模式的益处是,把后台的 AI 算力成本通明化了,用户用几多付几多。Captions 正在 2023 年 B 轮融资时就曾经实现了正现金流,这正在 AI 创业公司里几乎没人做到过。按照 AppFigures 的数据,过去 12 个月 Captions 的使用内收入约为 2840 万美元,此中 75% 来自美国以外的市场,全球化能力很凸起。General Catalyst 给这轮钱用的是一种特殊的“非稀释性本钱”布局,之前只要 Stripe 和 Gusto 拿过雷同的钱。General Catalyst 常务董事 Pranav Singhvi 对 Mirage 的评价是:Mirage 的贸易方程式很是成熟。而且发生很强的投资报答。若是你想想他们面临的市场,这正在某种意义上是一个无限大的可寻址市场。Gaurav Misra,CEO,出生正在,4 岁搬回印度新德里长大。正在印度,Misra 8 到 10 岁就跟哥哥一路编程做逛戏了。后来他去大学读了计较机科学,正在学校里学了机械进修的课程。结业后他先后正在微软 Azure 团队和几家创业公司干过,2016 年插手 Snap,一待就是 5 年。他正在 Snap 做到了设想工程担任人(Head of Design Engineering),这是一个融合设想和工程的夹杂脚色,特地担任立异和新产物标的目的。Snap Map、Spotlight(Snap 对标 TikTok 的短视频产物),他都参取了。正在 Snap 的这 5 年里,Misra 亲眼看到了短视频从一种内容形式变成了全球最支流的表达体例。 TikTok 迸发、Reels 跟进、Shorts 入场,短视频了几乎所有人的留意力。但他同时也发觉,绝大大都想做短视频的人底子不会剪辑。拍摄多次、剪辑门槛高、配音和字幕费时吃力,这些摩擦拦住了大量潜正在的创做者。另一位创始人 Dwight Churchill,COO,走的是完全分歧的线。他正在高盛做过消费金融平台 Marcus 的产物开辟,是Marcus 团队的晚期。正在高盛之前,他还正在 Taboola 做过开辟,后来转型成了产物司理。增加和贸易化是他的强项,他很清晰怎样把一个产物变成一弟子意。两小我最早正在一家叫 Localytics 的挪动阐发公司认识,其时正在分歧团队工做,但都寄望到了统一件事:短视频平台正正在疯狂增加,可是做视频的门槛完全没有降下来。2021 岁首年月,两人先后分开大公司,凑正在一路,花了两天时间做出了第一个产物原型。这就是前面提到的字幕 App。上线几天冲到 App Store 榜首,但每个月公费跨越 1 万美元办事器,两小我扛不住成本压力,决定先转向做照片社交。后面的工作我们曾经晓得了。照片 App 拿到了融资和日活,但被遗忘的字幕 App 正在没有任何推广和的环境下本人增加到了 50 万用户、50 万美元收入。Misra 和 Churchill 频频会商之后,做了一个让投资人和团队都有点严重的决定:砍掉照片分享 App,所有资本转向 AI 视频。用 Misra 后来的话说,这是他职业生活生计中机械进修、设想和快速产物原型制做完满交汇的时辰。从办理气概来看,Misra 很推崇速度和选择。他有几个被团队频频援用的准绳:「每个工程师每周都该当发布一个能够推向市场的工具」,若是时间不敷,就 「砍范畴,砍到再砍就没用了为止」,以及**「做为草创公司,你的工做就是承担手艺债权」**。公司内部有两套产物线图:一套基于用户需求,对外公开;另一套充满尝试性的立异设法,只正在内部畅通。Misra 认为,最大的胜利往往来自那些没人预见到的工具。AI 视频编纂东西市场 2024 年规模约 16 亿美元,到 2030 年估计将达到 93 亿美元,复合年增加率跨越 42%。若是把视野放得更宽,整个 AI 视频市场(包罗生成、编纂、分发)正在 2024 年就曾经是 112 亿美元 的体量,到 2034 年估计膨缩到 2460 亿美元。高盛估算,创做者经济正在 2024 年的规模大约是 2500 亿美元,估计到 2027 年将迫近 5000 亿美元。这些创做者中,84% 曾经正在利用 AI 东西。但同时,跨越一半的创做者年收入不到 1。5 万美元,这意味着他们对东西价钱很是。任何想正在这个市场里坐住脚的产物,都必需脚够廉价,或者脚够让人感觉“值”。大厂们早就脱手了。 CapCut(字节跳动旗下)是 Mirage 正在消费级市场碰到的最大敌手。2025 年,按照breakevenpointcalculator 统计,CapCut 的收入达到 8。15 亿美元,是全球收入最高的照片和视频使用。月活用户跨越 3 亿,Android 端下载量超 10 亿次,正在挪动视频编纂范畴占领 81% 的市场份额。更环节的是,CapCut 根基免费,背后还有TikTok 的庞大分发渠道。对用户来说,这些功能几乎是“随手就能用”的体验,不消额外安拆,不消进修成本,也不消额外花钱。Runway 是 AI 视频生成范畴的标杆,累计融了 5。44 亿美元,最新估值 30 亿美元,年化收入约 9000 万美元。Synthesia 是企业级 AI 视频的头部,它的数字人平台供给 230 多个虚拟抽象,支撑 140 多种言语,跨越 90% 的财富 100 强企业是它的客户。2025 年,Synthesia 以至了 Adobe 一笔 30 亿美元的收购要约。HeyGen 的客户年增加率跨越 1000%,Descript 年化收入接近 1 亿美元,Opus Clip 拿了跨越 6000 万美元融资做 AI 视频裁剪。光是 2025 年 1 月以来,AI 视频范畴的创业公司就总共筹集了跨越 5 亿美元的新资金。这里有一个更深层的问题:AI 视频功能正正在快速商品化。 以前需要几个月才能做出来的功能,现正在几周就能复制。a16z 合股人 Justine Moore 说得很间接:下一阶段的差同化不正在生成层,而正在“编纂层”。谁能把 AI 变成一个的后期制做团队,谁就能赢。这也是 Mirage 从 Captions 更名背后更深的逻辑。它不想只做一个 App,它想做一个平台,一个让 AI 端到端完成从素材到成片的工做流的平台。CEO Misra 正在 2026 年的融资通知布告里说了一句很成心思的话:正在 AI 时代,光有好产物不敷。赢正在获客效率和增加速度。这句话能够理解为,Mirage 曾经认识到,正在一个功能趋同、合作越来越激烈的市场里,手艺劣势的保质期越来越短。实正的护城河,可能是分发效率和本钱效率的组合。放正在 2026 年的语境下看,这句话有两层意义。一层是乐不雅的:AI 视频的市场还远远没有到天花板,机遇仍然庞大。另一层更沉着:目前的款式随时可能被,谁也不晓得最终赢家是谁。回看 Mirage 这 5 年的,从两天做出的字幕原型,到被遗忘一年半后本人长出来的产物,再到砍掉照片 App 全力转向 AI 视频,它的每一次环节转机都来自于对市场信号的捕获。用户用脚投票说字幕是刚需,他们就回头做字幕。短视频创做者需要更低门槛的出产东西,他们就把所有 AI 功能塞进一个 App。后来发觉企业也需要批量生成短视频告白,他们又开了 Mirage Studio。这家公司最出格的处所可能就正在这里:它从来没有什么弘大的起点,一曲是被市场推着走的,但每一步都踩对了。正在 AI 视频这个赛道里,大厂有钱有渠道,创业公司有速度有创意。Mirage 的赌注是,正在这两者之间存正在一个切确的生态位:用自研模子的手艺壁垒加上全球化分发的效率,正在短视频这个最公共、最高频的场景里跑出来。这个赌注能不克不及赢,取决于三件事:自研模子能不克不及持续领先、企业客户能不克不及实正跑起来、全球监管收紧的下能不克不及守住合规底线。但至多有一件事是确定的:当一个没人管的 App 本人长出了 50 万用户和 50 万美元收入的时候,它背儿女表的阿谁需求,是实正在的。
相关新闻