当一家AI“影视工厂”开始按周“焕新”
日期:2025-12-16 20:55:14 / 人气:6

上周,迪士尼宣布向OpenAI投资10亿美元并开放旗下IP版权授权。传统影视工业的巨头,终于没能抵挡住AI魔法的吸引,携其庞大的IP矩阵正式入场。
原因或许不难理解。走过百年历史的好莱坞,正面临着创意与故事的枯竭。耗资数亿、周期长达数年的大制作频频票房失利,其影响力甚至不及TikTok上日更的宠物短剧。
陈旧的叙事套路与缓慢的内容产出,早已难以匹配年轻一代的观影节奏。AI,或许正是电影工业重焕生机的一剂催化剂?
就在美国AI巨头与娱乐航母携手的同时,一家来自中国的初创团队,已悄然开启它的冲刺。
12月1日,ELSER.AI推出主打“新手易上手、高手可精控”的AI影视动漫智能体,面向首批邀请码用户启动内测。
仅一周后,12月8日,ELSER.AI即完成重大版本迭代,一次性上线八大功能:场景与道具一致性维护、高阶口型同步、多模型集成框架、自定义风格化、图像生成工具、视频生成工具、音频处理工具,以及备受关注的“一句话生成短片”智能体视频功能。
12月15日,ELSER.AI宣布全面开放注册,用户可通过邀请好友获得积分奖励。
从内测到全量上线仅用15天?一周内密集发布八大新功能?这背后是一个数百人的团队?程序员彻夜攻坚至凌晨?尽管AI创业本就处于争分夺秒的竞赛状态,但ELSER.AI的推进速度,依然刷新了行业认知。
带着这些疑问,我们深入探访了这家公司与其产品背后的故事。
一、从剧本到动画: Elser.AI 如何用智能体重塑短剧创作
传统动画制作流程繁复,涉及剧本、分镜、美术、配音等多环节协作,周期漫长。
Elser.AI正是瞄准这一痛点,试图以AI技术打破这一行业壁垒,最初从文生漫画工具切入,后开发了海外漫剧APP。2025年上半年获得多家机构投资后,团队开始全力研发面向短剧与漫剧的AI智能体。
12月1日,Elser.AI正式上线其首款一站式AI短剧生成智能体,并开放等候名单注册。该平台整合从剧本生成到视频合成的全流程,宣称能在几分钟内将用户的一个简单想法转化为专业级动画短片。
当前,用AI制作一段2-3分钟的精品短剧门槛仍然很高,通常需要组合多种工具、投入大量学习时间,并依赖创作者自身的叙事与美术能力。Elser.AI的短剧智能体直指这一痛点,用户仅需提供小说、剧本或初步创意,系统即可自动完成超过90%的工序,涵盖故事扩写、角色设定、分镜绘制、视频生成、配音对口型及剪辑等全链路。
与主流“一键生成”产品不同,Elser.AI深入调研创作流程,设置了“角色库”“分镜板”“剪辑板”三个核心控制界面。在AI完成初步生成后,创作者仍可通过提示词精细调整人物、构图、运镜等细节,实现“新手简单,高手可控”的设计目标。
“AI不是取代人,而是辅助人,让创意更快落地。”团队这样阐述其理念。其愿景是通过降低技术门槛,让更多人能够高效创作并分享自己的故事。
二、数据验证:静默增长与上线爆发
2025年,智能体(Agent)已成为大模型应用最具潜力的落地形态之一。然而,在不同场景中,Agent面临的困难程度、实现效果与产品形态差异显著。以当下最热门的内容形态——短剧为例,其对大模型与Agent提出的复杂要求,远超一般视频生成任务。
以OpenAI的Sora 2为例,其单次生成可产出10-15秒的高质量短片,但一旦扩展到2分钟乃至上百集的短剧体量,创作者便不得不进行大量重复“抽卡”与繁琐的人工拼接,结果仍难以保证角色、场景、声音、节奏的整体可控。
市面上常见的“类编程”一站式生成Agent在短剧场景中同样表现乏力,大量对质量有要求的创作者,实际上仍停留在“AI手工业时代”:手动撰写剧本,在Midjourney中生成图像,用Kling或即梦生成视频片段,通过ElevenLabs合成配音,再借助剪映进行剪辑拼接……流程割裂,效率低下。这也正是许多专业影视创作者至今对AI工具持保留态度的核心原因。
12月1日Elser.AI上线AI短剧智能体后,市场反响迅速:首日涌入用户超过3000人,单周访问量突破1.5万,并持续产生高额付费行为。
面对快速增长,团队并未急于推广,而是将重心转向 收集用户反馈,驱动敏捷迭代 。反馈主要来自两大群体:
1.专业创作者(如影视从业者、短剧编导) ,其诉求集中于 高阶可控性 :
场景与道具一致性:“人物能保持一致了,但道具和场景呢?总不能吕布的方天画戟变成丈八蛇矛,张小凡的青云山变成蜀山。”
模型与风格定制:“能否集成更多模型?我偏好特定风格。”“有没有更贴近‘凡人修仙传’的美术风格?”
精准口型同步:“口型为什么对不准?明明想让A角色说话,为什么是B角色的嘴在动?”
2.创作爱好者(如网文作者、二次元用户) ,其痛点在于 降低操作门槛 :
提示词使用:“只想让画面里的小狗显得更萌更小只,该怎么描述?”
镜头语言理解:“如何让两个角色自然地连续对话(实现正反打镜头)?”
基础剪辑需求:“生成的视频有一段冗余,如何快速删除?”
以“口型同步”为例:攻坚复杂需求,加速功能上线
用户的反馈并非意外。实际上,许多痛点在此前长达半年、覆盖数千人的用户调研中已被预见,相关功能开发早已启动。
以用户呼声最高的“高阶口型同步”功能为例,Elser团队为此进行了长达两个月的技术攻坚,探索了多种方案:
纯提示词控制:最简单,但口型与语音难以精准匹配,可控性差。
传统语音驱动视频:需两次生成,耗时漫长且口型容易失真崩坏。
直接使用Sora 2等音画同出模型:虽解决口型生成,但音色与角色表演完全不可控。
最终,团队找到了兼顾易用性与控制力的解决方案。在生成分镜与对白后,用户可开启“高阶口型同步”,系统将自动识别画面中所有角色,用户亦可直接框选指定人物。即使在“八仙过海”、“白雪公主与七个小矮人”这类多角色复杂场景中,也能实现“指哪打哪”——精确控制特定角色开口说话。
这项复杂功能原计划于12月底逐步上线。但在接收到海量用户反馈后,Elser团队决定提前发布 ,连同 场景道具一致性、多模型集成、风格自定义等共八大新功能 ,在12月8日、即产品上线仅一周后,便推送了一次大版本迭代。
三、八大功能闪电上新: Elser.AI 如何在两周内重塑AI短剧创作链路
在上一轮“口型同步”的技术攻坚后, Elser.AI并未停下脚步。12月1日产品全量上线带来的用户激增与海量反馈,让这个约30人的团队——其中产研仅20余人——开启了一场与时间赛跑的攻坚战。
他们的目标异常明确:必须在一周内,将此前已在研发中的多项功能打磨至可全量上线的状态,以回应用户最迫切的诉求。
团队迅速拆分为“7+1”的作战单元。CTO带领核心产研团队,负责攻坚“高阶口型同步”、“场景/道具资产库”等七项提升专业创作者效率的深度功能。而CEO刘耕则与一位全栈工程师组成特别小组,挑战一个更具普惠性的目标:开发一款“零基础也能快速生成短片”的智能体视频(Agentic Video)功能。
在五道口略显紧凑的工区内,键盘敲击声此起彼伏,一场围绕“让高手更可控、让新手更简单”的产品迭代狂飙就此展开。
一周后,八项新功能悉数完成并开启内测。又一周后,即12月15日,这些功能已成功整合,随Elser.AI平台全量上线。除了已详细介绍过的“高阶口型同步”功能,Elser.AI此次上新的其余七大功能,可清晰地分为服务于“高手”的深度控制工具与服务于“新手”的便捷入门工具两大类。
1.场景与道具资产库:构建专属的视觉世界 对于长篇叙事,角色、场景与道具的一致性至关重要。Elser.AI上线的资产库功能,允许创作者预先定义并保存关键的场景与道具。在后续分镜设计中,仅需一个“@”符号即可随时调用,确保“李逍遥手中的无尘剑”或“锁妖塔的特定场景”在整个剧集中始终保持一致,从根本上解决了长内容生成中的资产漂移问题。
尽管平台已内置近50种涵盖动漫、影视、艺术史的视觉滤镜,但为了满足专业创作者对独特美学风格的追求,Elser.AI推出了风格自定义功能。
用户可以基于参考图或详细描述,训练并保存专属风格模型,并将其应用于整个作品。例如,具备中国画背景的CEO刘耕,便亲自创建了独特的“唐伯虎风格”,使其作品拥有了极高的辨识度。
“多模型集成”看似仅是API调用,但对初创公司而言,在质量、并发、速度与稳定性间取得平衡挑战巨大。Elser.AI建立了包含205项细目的内部美学评估标准,仅人脸评估就涉及7个维度。在此标准下,团队克服了资源限制,接入了包括Seadream、可灵、Minimax、Nano Banana pro、Vidu、Flux Contezt pro、Sora2、Suno等在内的国内外顶尖模型,并计划持续接入Veo、Midjourney等更多选项,为用户提供兼具品质与多样性的生成选择。
对于初学者,直接创作动画可能门槛过高。新上线的生图工具允许用户通过自然语言描述,快速生成角色设计、场景概念图或宣传海报。该工具集成了多个顶级生图模型,生成的优质图片可直接存入资产库,作为后续动画创作的素材,实现了从静态到动态创作的平滑过渡。
该工具整合了文生视频、图生视频(含首尾帧控制、参考视频生成)等多种模式,并接入了主流视频生成模型。用户无需在不同应用间切换,即可在一个平台内尝试不同模型的生成效果,极大地简化了视频素材的创作与测试流程。
音频工具不仅提供多语种、多情感的语音合成,更上线了高质量的声音克隆功能。用户可通过简短录音或上传音频样本,快速创建专属音色。这项功能既可独立用于制作音频内容,也可无缝嵌入到动画角色的配音环节中,为角色注入独一无二的声音灵魂。
作为本次迭代的“重磅级”功能,它旨在实现创作的终极简化。用户仅需输入一个故事梗概或创意想法,智能体将自动完成从剧本润色、分镜设计到成片生成的全流程。该功能目前处于定向邀请测试阶段,即将全面开放,标志着“零基础创作动画短片”成为可能。
Elser.AI在两周内的急速迭代,其意义远不止于功能数量的增加。这八大功能共同勾勒出一个清晰的产品哲学: AI创作工具的未来,不在于追求全自动的“盲盒”,而在于构建一个“深度可控”的创作环境。
它既为专业创作者提供了堪比专业软件的精细控制能力(资产库、风格自定义),又为普通爱好者铺设了毫无障碍的入门阶梯(一句话成片、便捷工具)。这种分层与融合,正是解决当前AI视频生成在“质量”与“易用性”之间矛盾的一次有效实践。
当其他团队仍在纠结于生成长度的限制时,Elser.AI已经将目光投向了更本质的问题:如何让AI真正理解并服务于人的创意,而不仅仅是执行指令。这场始于五道口工区的“狂飙”,或许正在为整个AIGC内容创作领域,探索一条全新的路径。
推出“一键生成短剧”的Agentic Video功能,对Elser团队而言并非一个轻易的决定。
早在今年8月,Sora2尚未发布之前,团队就曾开发过一个初步版本并邀请用户内测。但经过内部讨论,项目被暂时搁置。核心原因在于团队对自身使命的坚持:Elser的长期目标是打造一个“AI驱动的IP梦工厂”及下一代AI原生娱乐社区。在这个过程中,释放人的创意与审美被视为决定性因素,而“一键式”的自动化流程,在当时看来可能难以承载消费级的内容深度,亦可能模糊不同创作者基于热爱与努力所呈现的差异。
然而,12月1日产品全量上线后,来自纯爱好者的海量反馈促使团队重新审视这一功能。他们意识到,尽管“一键式”智能体或许难以直接成就一个梦工厂,但它却能成为爱好者体验AI创作魅力的绝佳入口,同时也能满足部分场景下的批量内容生成需求,其探索价值不容忽视。
新的挑战随之而来:开发此类功能,通常需要一个10-20人的团队耗费两个月。而当时Elser的核心资源正全力保障其他关键功能上线,难以抽调人手。但既然明确了用户需求,团队便不愿等待。
CEO刘耕与全栈工程师邱世章主动请缨,组成两人攻坚小组,目标是在7天内交付一个可内测的版本。
两人的协作高效而紧密。基于现有的智能体开发平台,刘耕在白天需要密集会见多家投资机构,推进公司新一轮融资;夜晚则切换回产品经理角色,调试智能体流程、优化提示词、并凭借其行业专家经验测试生成效果,持续迭代。整整一周,他每天都工作至凌晨两点以后,而次日清晨六点半又会准时醒来。邱世章则负责接力,将验证通过的流程工程化,提升代码质量与系统稳定性,优化智能体调度逻辑,同样奋战至深夜。
一周后,Agentic Video功能如期上线并启动内测。 这个极速验证的案例也印证了一个高效的产品开发范式: 一个深度理解AI、智能体与行业需求的产品专家,搭配一位顶级的全栈工程师,可以构成最敏捷的攻坚单元,快速完成从场景验证到产品落地的闭环。
两人的状态,是整个Elser团队的缩影。在冲刺上线的关键阶段,团队已连续放弃了三个周末,自发加班以确保进度。一种将Elser视为自身事业的强烈认同感,驱动着所有人。
当被问及如何驱动团队保持这样的投入度时,刘耕的回答坦诚而直接:“没有高压管理,也没有空头许诺。创业首先源于大家对这件事本身的认同和自驱力。在创业公司,我们很难提供大厂般的高薪和稳定,那为什么这些优秀的伙伴仍选择加入?”
“因为尽管创业充满风险,但这件事一旦做成,每个身处其中的人都将获得前所未有的成就感。一起冒险,一起奋斗,一起分享成果——这是我的价值观,我们也正是用这样的价值观,去凝聚志同道合的‘冒险家’。”
“此外,我和早期创始团队成员,永远会和后来加入的伙伴一样,战斗在第一线。如果大家都全力以赴,那我必须成为最拼的那个。其实这段时间,同事们常劝我,白天融资谈判已经够累,晚上就别再加班了,让我多休息。”
“但我停不下来。只要还有一丝力气,我就会想着还有用户需求亟待响应,还有功能可以优化,还有更好的内容等待被创造……我心中始终萦绕着一句话:‘我想赢。’我必须带着这些信任我们的伙伴,去赢得这场竞赛。”
这位曾是武汉大学硕士生导师、副教授,也曾是字节跳动瓜瓜龙语文教研负责人、大力教育创新研究院院长的创业者,此刻流露出的,是一种近乎“草根创业者”的坚韧与赤诚。
“最艰难的是去年,有两个月青黄不接。我找朋友借钱发了工资,确保没有拖欠任何人。为了省钱,我自己每天只吃包子。同事约吃饭,我都推说不饿,其实是不想让他们担心。那时有人问我,后悔放弃大学里每周只需工作半天的悠闲吗?后悔放弃字节150万以上的年薪吗?”
“不后悔。因为我已经在取经的路上了。你是更爱看历经八十一难的闯关过程,还是更爱看最终取得真经的那一纸文书?创业路上有太多需要学习和经历的事。我很庆幸,在获得足够资源之前,就先学会了如何吃苦。”
五、速度不是终极武器:热爱与专业构筑的护城河
据我们了解,全量上线后,Elser.AI在未来很长一段时间内,仍将保持按周迭代的“焕新”节奏。一系列新功能早已进入研发管线,正被精心打磨至90分以上再择机发布。
这其中包括:
多图生视频智能体:用户上传几张剧照或照片,AI即可解析故事,将其转化为指定风格的动态视频。
高阶场景一致性功能:提供多种参考路径,在复杂环境变化中确保背景的高度统一。
一体化漫画工具:提供从故事、分镜到对话框的精细化编辑,一站式生成消费级漫画。
故事辅助工具集:涵盖小说转剧本、创意激发、小说生成等全流程辅助。
更强大的Agentic Video:扩展至更多专业化垂直场景。
神秘的“Genspace”生成空间:旨在满足专业创作者对分镜细节超过95%的精细化控制期待。……以及更多尚未披露的规划。
在短短两周内,Elser以“挑剔级”的短剧智能体为核心,迅速扩展为一个覆盖从生图、生视频到专业影视动漫制作的 AI驱动IP内容生产全链路平台 。其长远愿景,是构建一个名为“Elseland”的下一代AI原生互娱社区。
当被问及在竞争白热化的AI视频赛道,速度是否会成为其核心武器时,刘耕给出了否定的答案:“不是。单纯比拼速度,只能是一段时间内的竞争手段。团队不可能永远处于氮气加速状态。 唯有热爱与专业,才能构筑持久的竞争力。 热爱让团队以梦为马,不知疲倦;专业让团队尊重事实,脚踏实地。这也是我离开字节后,依然时常提及的理念——‘务实的浪漫主义’。”
“我们从第一天起,目标就是这件事:打造一个开放、平权、有趣的AI原生内容社区。三年了,我们在探索中经历过无数低谷与等待,也不断寻找新的切入点,但从未改变方向。从AI故事、AI漫画再到AI影视,我们伴随着技术的发展,持续将能力升级至体验更丰富的内容形态。而贯穿始终的核心,是 我们对叙事、对表达这件事本身的热爱与坚持 。”
“别人为何做这件事,我不清楚。但对我而言,这是 我必须完成的事业 。”“我从12岁开始写作。为了追求艺术与美的极致,大学时我转学文科,钻研美学长达13年。我经历过投稿无门的茫然,深切体会过普通创作者的艰难;我也见证并帮助过头部内容创作者的成长,看到他们如何改变自己的人生……”
“每个人都有自己的故事。在过去,大多数普通人的故事散落尘埃,无人知晓。而现在,AI赋予了每个人机会,将属于自己的故事转化为永恒的影像。”
“比如我们的产品经理,用自己的故事创作了动画,并用她自己的声音讲述出来。又比如我们的研发工程师,每天下班后用AI为孩子编织故事,一周内在小红书就收获了大量关注。最让我惊喜的,是他们在使用我们工具过程中展现出的‘成长性’——从最初简单的视频,到短短半个月后叙事与影像水平的大幅跃升……”
始于热爱,成于专业。 在AI时代,普通人源于内心的梦想与坚持,或许正是最难以被算法和技术取代的价值所在。这也可能是一家创业公司,在面对资源雄厚的大厂时,为数不多却坚实的立足点。
于是,在OpenAI与迪士尼达成十亿美元级“世纪联姻”的同时,中国的创业者们,继续着他们“以梦为马”的征程。"
作者:天富注册登录平台
新闻资讯 News
- 晨光文具的"中年突围":从校门口...12-16
- 定位咨询为何在中国成咨询业大生...12-16
- 缩量厮杀与范式突围:民营加油站...12-16
- H200 采购困局:在依赖与自主间...12-16

