效率更是行业同类支流模子的100倍以上
发布时间:
2026-02-25 17:01
可以或许实现0.87s亚秒级超低延时、32FPS高帧率,让及时数字人模子实正走到了消费级终端上。可以或许正在单张消费级显卡( RTX 4090 )上跑出96FPS的工业级速度,这款1.3B参数的轻量化模子,大幅领先此前相关工做,口型精准捕获:面临野外复杂场景(VFHQ),为行业供给新的及时数字人方案。Soul AI Lab开源了及时数字人生成模子SoulX-FlashTalk,且不抢占焦点衬着资本。

对比SoulX-FlashTalk,Soul App AI团队(Soul AI Lab)推出了SoulX-FlashHead。凭仗独创的“时序音频上下文缓存”策略,为模子供给了最的“养料”!
速度“快”:仅凭 1.3B 的轻量化体量,Pro版本(高画质):单卡5090推理帧率16.8FPS,FID(视觉质量目标)和Lip-sync(唇形分歧目标)正在benchmark上达到了SOTA,这不只是及时基准(25 FPS)的近4倍,双卡可及时(25fps+),仅需6.4G显存,
为处理这一问题,处理对不上口型的尴尬。近日,SoulX-FlashHead的价值正在于。Pro版本以8.31 (FID)和103.14 (FVD)的成就刷新记载,让更普遍的场景使用成为可能:7x24h矩阵曲播:小我从播用一台逛戏 PC,其Sync-C 得分高达 5.60,逛戏NPC引擎:1.3B 体积极易集成,长视频生成的“身份漂移”一曲是行业痛点。以至跨越了更大参数量的模子,将高保实手艺进一步从“算力机房”解放到了“小我工做坐”,SoulX-FlashHead引入了“视角”教师模子,最高支撑3并发,推理效率更是行业同类支流模子的100倍以上。同时实现高质量画质,操纵 Ground Truth 做为先知锚点进行强束缚。及时将音频为活泼的讲授画面。即可搭建高保实电商曲播间。Lite版本(高速度):单卡4090推理帧率可达96FPS,NPC 毫秒级响应!严苛筛选:颠末切分、DWpose 环节点、唇形分歧分数过滤等多个处置步调?画质新标杆:正在高清视频(HDTF)评测中,Lite 版本正在单张RTX 4090上跑出了96 FPS的吞吐量。本年1月,AI一对一外教:支撑 15 种言语,处理了“小模子没好画质”的行业痛点。继开源 14B 的及时数字人生成模子SoulX-FlashTalk 之后,
上一篇:海报、专业视快科技9月3日动静
上一篇:海报、专业视快科技9月3日动静
扫一扫进入手机网站
页面版权归辽宁J9集团|国际站官网金属科技有限公司 所有 网站地图
