📢 GM!Gate 广场|4/5 热议:#假期持币指南
🌿 踏青还是盯盘?#假期持币指南 带你过个“松弛感”长假!
春光正好,你是选择在山间深呼吸,还是在 K 线里找时机?在这个清明假期,晒出你的持币态度,做个精神饱满的交易员!
🎁 分享生活/交易感悟,抽 5 位锦鲤瓜分 $1,000 仓位体验券!
💬 茶余饭后聊聊:
1️⃣ 休假心态: 你是“关掉通知、彻底失联”派,还是“每 30 分钟必刷行情”派?
2️⃣ 懒人秘籍: 假期不想盯盘?分享你的“挂机”策略(定投/网格/理财)。
3️⃣ 四月展望: 假期过后,你最看好哪个币种“春暖花开”?
分享你的假期姿态 👉 https://www.gate.com/post
📅 4/4 15:00 - 4/6 18:00 (UTC+8)
Netflix推出VOID:用于物理一致性视频对象移除的开源框架
简述
Netflix已发布VOID,这是一个开源AI框架,可在移除视频中的物体的同时保留逼真的物理交互,为专业视频制作提供了比传统修补(inpainting)工具更先进的替代方案。
从历史上看,从场景中移除某个物体一直相对简单,但要确保其后的环境表现得真实自然则面临重大挑战。例如,删除一个拿着吉他的人的同时,乐器可能会以不自然的方式悬挂在空中;从泳池中移除一名潜水员,则可能导致水面不发生变化。视觉特效团队过去通常需要手动修正这类问题,这是一个耗时的过程,单个镜头的修复可能从数天延长到数周。
VOID(Video Object and Interaction Deletion的缩写)旨在解决这些复杂情况。不同于仅仅用来填补缺失像素的传统方法,该系统在移除物体之后会预测场景中物理一致的结果
它结合多种技术来实现这一点。谷歌的Gemini会分析场景,以识别删除操作将影响哪些区域;Meta的SAM2则对需要移除的物体进行分割。这些输出会被编码到一个quadmask(四值掩码)中:该四值图用于指示哪些区域需要擦除、哪些区域会发生重叠、哪些区域会受到物理影响,以及哪些区域将保持不变。基于阿里巴巴CogVideoX构建的视频扩散模型随后以物理上可信的方式重建场景。可选的第二次处理会应用光流,以纠正初次重建可能引入的任何形变。
在视频制作中展示物理一致的物体移除
VOID的演示带来了令人信服的效果:当移除手持者后,气球会上升得更自然;当删除与之无关的方块时,方块仍能保持稳定;在将一个人擦除之后,泳池表面不会受到影响。在一项包含25名参与者的人类偏好研究中,VOID在64.8%的情况下被选择,表现优于Runway(一款领先的商业替代方案),后者仅获得18.4%的选择率。