当一家AI“影视工厂”开始按周“焕新”

日期：2025-12-16 20:55:14 / 人气：115

上周，迪士尼宣布向OpenAI投资10亿美元并开放旗下IP版权授权。传统影视工业的巨头，终于没能抵挡住AI魔法的吸引，携其庞大的IP矩阵正式入场。
原因或许不难理解。走过百年历史的好莱坞，正面临着创意与故事的枯竭。耗资数亿、周期长达数年的大制作频频票房失利，其影响力甚至不及TikTok上日更的宠物短剧。
陈旧的叙事套路与缓慢的内容产出，早已难以匹配年轻一代的观影节奏。AI，或许正是电影工业重焕生机的一剂催化剂？
就在美国AI巨头与娱乐航母携手的同时，一家来自中国的初创团队，已悄然开启它的冲刺。
12月1日，ELSER.AI推出主打“新手易上手、高手可精控”的AI影视动漫智能体，面向首批邀请码用户启动内测。
仅一周后，12月8日，ELSER.AI即完成重大版本迭代，一次性上线八大功能：场景与道具一致性维护、高阶口型同步、多模型集成框架、自定义风格化、图像生成工具、视频生成工具、音频处理工具，以及备受关注的“一句话生成短片”智能体视频功能。
12月15日，ELSER.AI宣布全面开放注册，用户可通过邀请好友获得积分奖励。
从内测到全量上线仅用15天？一周内密集发布八大新功能？这背后是一个数百人的团队？程序员彻夜攻坚至凌晨？尽管AI创业本就处于争分夺秒的竞赛状态，但ELSER.AI的推进速度，依然刷新了行业认知。
带着这些疑问，我们深入探访了这家公司与其产品背后的故事。
一、从剧本到动画： Elser.AI 如何用智能体重塑短剧创作
传统动画制作流程繁复，涉及剧本、分镜、美术、配音等多环节协作，周期漫长。
Elser.AI正是瞄准这一痛点，试图以AI技术打破这一行业壁垒，最初从文生漫画工具切入，后开发了海外漫剧APP。2025年上半年获得多家机构投资后，团队开始全力研发面向短剧与漫剧的AI智能体。
12月1日，Elser.AI正式上线其首款一站式AI短剧生成智能体，并开放等候名单注册。该平台整合从剧本生成到视频合成的全流程，宣称能在几分钟内将用户的一个简单想法转化为专业级动画短片。
当前，用AI制作一段2-3分钟的精品短剧门槛仍然很高，通常需要组合多种工具、投入大量学习时间，并依赖创作者自身的叙事与美术能力。Elser.AI的短剧智能体直指这一痛点，用户仅需提供小说、剧本或初步创意，系统即可自动完成超过90%的工序，涵盖故事扩写、角色设定、分镜绘制、视频生成、配音对口型及剪辑等全链路。
与主流“一键生成”产品不同，Elser.AI深入调研创作流程，设置了“角色库”“分镜板”“剪辑板”三个核心控制界面。在AI完成初步生成后，创作者仍可通过提示词精细调整人物、构图、运镜等细节，实现“新手简单，高手可控”的设计目标。
“AI不是取代人，而是辅助人，让创意更快落地。”团队这样阐述其理念。其愿景是通过降低技术门槛，让更多人能够高效创作并分享自己的故事。
二、数据验证：静默增长与上线爆发
2025年，智能体（Agent）已成为大模型应用最具潜力的落地形态之一。然而，在不同场景中，Agent面临的困难程度、实现效果与产品形态差异显著。以当下最热门的内容形态——短剧为例，其对大模型与Agent提出的复杂要求，远超一般视频生成任务。
以OpenAI的Sora 2为例，其单次生成可产出10-15秒的高质量短片，但一旦扩展到2分钟乃至上百集的短剧体量，创作者便不得不进行大量重复“抽卡”与繁琐的人工拼接，结果仍难以保证角色、场景、声音、节奏的整体可控。
市面上常见的“类编程”一站式生成Agent在短剧场景中同样表现乏力，大量对质量有要求的创作者，实际上仍停留在“AI手工业时代”：手动撰写剧本，在Midjourney中生成图像，用Kling或即梦生成视频片段，通过ElevenLabs合成配音，再借助剪映进行剪辑拼接……流程割裂，效率低下。这也正是许多专业影视创作者至今对AI工具持保留态度的核心原因。
12月1日Elser.AI上线AI短剧智能体后，市场反响迅速：首日涌入用户超过3000人，单周访问量突破1.5万，并持续产生高额付费行为。
面对快速增长，团队并未急于推广，而是将重心转向收集用户反馈，驱动敏捷迭代。反馈主要来自两大群体：
1.专业创作者（如影视从业者、短剧编导），其诉求集中于高阶可控性：
场景与道具一致性：“人物能保持一致了，但道具和场景呢？总不能吕布的方天画戟变成丈八蛇矛，张小凡的青云山变成蜀山。”
模型与风格定制：“能否集成更多模型？我偏好特定风格。”“有没有更贴近‘凡人修仙传’的美术风格？”
精准口型同步：“口型为什么对不准？明明想让A角色说话，为什么是B角色的嘴在动？”
2.创作爱好者（如网文作者、二次元用户），其痛点在于降低操作门槛：
提示词使用：“只想让画面里的小狗显得更萌更小只，该怎么描述？”
镜头语言理解：“如何让两个角色自然地连续对话（实现正反打镜头）？”
基础剪辑需求：“生成的视频有一段冗余，如何快速删除？”
以“口型同步”为例：攻坚复杂需求，加速功能上线
用户的反馈并非意外。实际上，许多痛点在此前长达半年、覆盖数千人的用户调研中已被预见，相关功能开发早已启动。
以用户呼声最高的“高阶口型同步”功能为例，Elser团队为此进行了长达两个月的技术攻坚，探索了多种方案：
纯提示词控制：最简单，但口型与语音难以精准匹配，可控性差。
传统语音驱动视频：需两次生成，耗时漫长且口型容易失真崩坏。
直接使用Sora 2等音画同出模型：虽解决口型生成，但音色与角色表演完全不可控。
最终，团队找到了兼顾易用性与控制力的解决方案。在生成分镜与对白后，用户可开启“高阶口型同步”，系统将自动识别画面中所有角色，用户亦可直接框选指定人物。即使在“八仙过海”、“白雪公主与七个小矮人”这类多角色复杂场景中，也能实现“指哪打哪”——精确控制特定角色开口说话。
这项复杂功能原计划于12月底逐步上线。但在接收到海量用户反馈后，Elser团队决定提前发布，连同场景道具一致性、多模型集成、风格自定义等共八大新功能，在12月8日、即产品上线仅一周后，便推送了一次大版本迭代。
三、八大功能闪电上新： Elser.AI 如何在两周内重塑AI短剧创作链路
在上一轮“口型同步”的技术攻坚后， Elser.AI并未停下脚步。12月1日产品全量上线带来的用户激增与海量反馈，让这个约30人的团队——其中产研仅20余人——开启了一场与时间赛跑的攻坚战。
他们的目标异常明确：必须在一周内，将此前已在研发中的多项功能打磨至可全量上线的状态，以回应用户最迫切的诉求。
团队迅速拆分为“7+1”的作战单元。CTO带领核心产研团队，负责攻坚“高阶口型同步”、“场景/道具资产库”等七项提升专业创作者效率的深度功能。而CEO刘耕则与一位全栈工程师组成特别小组，挑战一个更具普惠性的目标：开发一款“零基础也能快速生成短片”的智能体视频（Agentic Video）功能。
在五道口略显紧凑的工区内，键盘敲击声此起彼伏，一场围绕“让高手更可控、让新手更简单”的产品迭代狂飙就此展开。
一周后，八项新功能悉数完成并开启内测。又一周后，即12月15日，这些功能已成功整合，随Elser.AI平台全量上线。除了已详细介绍过的“高阶口型同步”功能，Elser.AI此次上新的其余七大功能，可清晰地分为服务于“高手”的深度控制工具与服务于“新手”的便捷入门工具两大类。
1.场景与道具资产库：构建专属的视觉世界对于长篇叙事，角色、场景与道具的一致性至关重要。Elser.AI上线的资产库功能，允许创作者预先定义并保存关键的场景与道具。在后续分镜设计中，仅需一个“@”符号即可随时调用，确保“李逍遥手中的无尘剑”或“锁妖塔的特定场景”在整个剧集中始终保持一致，从根本上解决了长内容生成中的资产漂移问题。
尽管平台已内置近50种涵盖动漫、影视、艺术史的视觉滤镜，但为了满足专业创作者对独特美学风格的追求，Elser.AI推出了风格自定义功能。
用户可以基于参考图或详细描述，训练并保存专属风格模型，并将其应用于整个作品。例如，具备中国画背景的CEO刘耕，便亲自创建了独特的“唐伯虎风格”，使其作品拥有了极高的辨识度。
“多模型集成”看似仅是API调用，但对初创公司而言，在质量、并发、速度与稳定性间取得平衡挑战巨大。Elser.AI建立了包含205项细目的内部美学评估标准，仅人脸评估就涉及7个维度。在此标准下，团队克服了资源限制，接入了包括Seadream、可灵、Minimax、Nano Banana pro、Vidu、Flux Contezt pro、Sora2、Suno等在内的国内外顶尖模型，并计划持续接入Veo、Midjourney等更多选项，为用户提供兼具品质与多样性的生成选择。
对于初学者，直接创作动画可能门槛过高。新上线的生图工具允许用户通过自然语言描述，快速生成角色设计、场景概念图或宣传海报。该工具集成了多个顶级生图模型，生成的优质图片可直接存入资产库，作为后续动画创作的素材，实现了从静态到动态创作的平滑过渡。
该工具整合了文生视频、图生视频（含首尾帧控制、参考视频生成）等多种模式，并接入了主流视频生成模型。用户无需在不同应用间切换，即可在一个平台内尝试不同模型的生成效果，极大地简化了视频素材的创作与测试流程。
音频工具不仅提供多语种、多情感的语音合成，更上线了高质量的声音克隆功能。用户可通过简短录音或上传音频样本，快速创建专属音色。这项功能既可独立用于制作音频内容，也可无缝嵌入到动画角色的配音环节中，为角色注入独一无二的声音灵魂。
作为本次迭代的“重磅级”功能，它旨在实现创作的终极简化。用户仅需输入一个故事梗概或创意想法，智能体将自动完成从剧本润色、分镜设计到成片生成的全流程。该功能目前处于定向邀请测试阶段，即将全面开放，标志着“零基础创作动画短片”成为可能。
Elser.AI在两周内的急速迭代，其意义远不止于功能数量的增加。这八大功能共同勾勒出一个清晰的产品哲学： AI创作工具的未来，不在于追求全自动的“盲盒”，而在于构建一个“深度可控”的创作环境。
它既为专业创作者提供了堪比专业软件的精细控制能力（资产库、风格自定义），又为普通爱好者铺设了毫无障碍的入门阶梯（一句话成片、便捷工具）。这种分层与融合，正是解决当前AI视频生成在“质量”与“易用性”之间矛盾的一次有效实践。
当其他团队仍在纠结于生成长度的限制时，Elser.AI已经将目光投向了更本质的问题：如何让AI真正理解并服务于人的创意，而不仅仅是执行指令。这场始于五道口工区的“狂飙”，或许正在为整个AIGC内容创作领域，探索一条全新的路径。
推出“一键生成短剧”的Agentic Video功能，对Elser团队而言并非一个轻易的决定。
早在今年8月，Sora2尚未发布之前，团队就曾开发过一个初步版本并邀请用户内测。但经过内部讨论，项目被暂时搁置。核心原因在于团队对自身使命的坚持：Elser的长期目标是打造一个“AI驱动的IP梦工厂”及下一代AI原生娱乐社区。在这个过程中，释放人的创意与审美被视为决定性因素，而“一键式”的自动化流程，在当时看来可能难以承载消费级的内容深度，亦可能模糊不同创作者基于热爱与努力所呈现的差异。
然而，12月1日产品全量上线后，来自纯爱好者的海量反馈促使团队重新审视这一功能。他们意识到，尽管“一键式”智能体或许难以直接成就一个梦工厂，但它却能成为爱好者体验AI创作魅力的绝佳入口，同时也能满足部分场景下的批量内容生成需求，其探索价值不容忽视。
新的挑战随之而来：开发此类功能，通常需要一个10-20人的团队耗费两个月。而当时Elser的核心资源正全力保障其他关键功能上线，难以抽调人手。但既然明确了用户需求，团队便不愿等待。
CEO刘耕与全栈工程师邱世章主动请缨，组成两人攻坚小组，目标是在7天内交付一个可内测的版本。
两人的协作高效而紧密。基于现有的智能体开发平台，刘耕在白天需要密集会见多家投资机构，推进公司新一轮融资；夜晚则切换回产品经理角色，调试智能体流程、优化提示词、并凭借其行业专家经验测试生成效果，持续迭代。整整一周，他每天都工作至凌晨两点以后，而次日清晨六点半又会准时醒来。邱世章则负责接力，将验证通过的流程工程化，提升代码质量与系统稳定性，优化智能体调度逻辑，同样奋战至深夜。
一周后，Agentic Video功能如期上线并启动内测。这个极速验证的案例也印证了一个高效的产品开发范式：一个深度理解AI、智能体与行业需求的产品专家，搭配一位顶级的全栈工程师，可以构成最敏捷的攻坚单元，快速完成从场景验证到产品落地的闭环。
两人的状态，是整个Elser团队的缩影。在冲刺上线的关键阶段，团队已连续放弃了三个周末，自发加班以确保进度。一种将Elser视为自身事业的强烈认同感，驱动着所有人。
当被问及如何驱动团队保持这样的投入度时，刘耕的回答坦诚而直接：“没有高压管理，也没有空头许诺。创业首先源于大家对这件事本身的认同和自驱力。在创业公司，我们很难提供大厂般的高薪和稳定，那为什么这些优秀的伙伴仍选择加入？”
“因为尽管创业充满风险，但这件事一旦做成，每个身处其中的人都将获得前所未有的成就感。一起冒险，一起奋斗，一起分享成果——这是我的价值观，我们也正是用这样的价值观，去凝聚志同道合的‘冒险家’。”
“此外，我和早期创始团队成员，永远会和后来加入的伙伴一样，战斗在第一线。如果大家都全力以赴，那我必须成为最拼的那个。其实这段时间，同事们常劝我，白天融资谈判已经够累，晚上就别再加班了，让我多休息。”
“但我停不下来。只要还有一丝力气，我就会想着还有用户需求亟待响应，还有功能可以优化，还有更好的内容等待被创造……我心中始终萦绕着一句话：‘我想赢。’我必须带着这些信任我们的伙伴，去赢得这场竞赛。”
这位曾是武汉大学硕士生导师、副教授，也曾是字节跳动瓜瓜龙语文教研负责人、大力教育创新研究院院长的创业者，此刻流露出的，是一种近乎“草根创业者”的坚韧与赤诚。
“最艰难的是去年，有两个月青黄不接。我找朋友借钱发了工资，确保没有拖欠任何人。为了省钱，我自己每天只吃包子。同事约吃饭，我都推说不饿，其实是不想让他们担心。那时有人问我，后悔放弃大学里每周只需工作半天的悠闲吗？后悔放弃字节150万以上的年薪吗？”
“不后悔。因为我已经在取经的路上了。你是更爱看历经八十一难的闯关过程，还是更爱看最终取得真经的那一纸文书？创业路上有太多需要学习和经历的事。我很庆幸，在获得足够资源之前，就先学会了如何吃苦。”
五、速度不是终极武器：热爱与专业构筑的护城河
据我们了解，全量上线后，Elser.AI在未来很长一段时间内，仍将保持按周迭代的“焕新”节奏。一系列新功能早已进入研发管线，正被精心打磨至90分以上再择机发布。
这其中包括：
多图生视频智能体：用户上传几张剧照或照片，AI即可解析故事，将其转化为指定风格的动态视频。
高阶场景一致性功能：提供多种参考路径，在复杂环境变化中确保背景的高度统一。
一体化漫画工具：提供从故事、分镜到对话框的精细化编辑，一站式生成消费级漫画。
故事辅助工具集：涵盖小说转剧本、创意激发、小说生成等全流程辅助。
更强大的Agentic Video：扩展至更多专业化垂直场景。
神秘的“Genspace”生成空间：旨在满足专业创作者对分镜细节超过95%的精细化控制期待。……以及更多尚未披露的规划。
在短短两周内，Elser以“挑剔级”的短剧智能体为核心，迅速扩展为一个覆盖从生图、生视频到专业影视动漫制作的 AI驱动IP内容生产全链路平台。其长远愿景，是构建一个名为“Elseland”的下一代AI原生互娱社区。
当被问及在竞争白热化的AI视频赛道，速度是否会成为其核心武器时，刘耕给出了否定的答案：“不是。单纯比拼速度，只能是一段时间内的竞争手段。团队不可能永远处于氮气加速状态。唯有热爱与专业，才能构筑持久的竞争力。热爱让团队以梦为马，不知疲倦；专业让团队尊重事实，脚踏实地。这也是我离开字节后，依然时常提及的理念——‘务实的浪漫主义’。”
“我们从第一天起，目标就是这件事：打造一个开放、平权、有趣的AI原生内容社区。三年了，我们在探索中经历过无数低谷与等待，也不断寻找新的切入点，但从未改变方向。从AI故事、AI漫画再到AI影视，我们伴随着技术的发展，持续将能力升级至体验更丰富的内容形态。而贯穿始终的核心，是我们对叙事、对表达这件事本身的热爱与坚持。”
“别人为何做这件事，我不清楚。但对我而言，这是我必须完成的事业。”“我从12岁开始写作。为了追求艺术与美的极致，大学时我转学文科，钻研美学长达13年。我经历过投稿无门的茫然，深切体会过普通创作者的艰难；我也见证并帮助过头部内容创作者的成长，看到他们如何改变自己的人生……”
“每个人都有自己的故事。在过去，大多数普通人的故事散落尘埃，无人知晓。而现在，AI赋予了每个人机会，将属于自己的故事转化为永恒的影像。”
“比如我们的产品经理，用自己的故事创作了动画，并用她自己的声音讲述出来。又比如我们的研发工程师，每天下班后用AI为孩子编织故事，一周内在小红书就收获了大量关注。最让我惊喜的，是他们在使用我们工具过程中展现出的‘成长性’——从最初简单的视频，到短短半个月后叙事与影像水平的大幅跃升……”
始于热爱，成于专业。在AI时代，普通人源于内心的梦想与坚持，或许正是最难以被算法和技术取代的价值所在。这也可能是一家创业公司，在面对资源雄厚的大厂时，为数不多却坚实的立足点。
于是，在OpenAI与迪士尼达成十亿美元级“世纪联姻”的同时，中国的创业者们，继续着他们“以梦为马”的征程。"

作者：天富注册登录平台

当一家AI“影视工厂”开始按周“焕新”

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →