火山引擎职位架构(火山引擎虚拟换装技术大突破)
火山引擎职位架构(火山引擎虚拟换装技术大突破)
2024-09-29 05:18:30  作者:醒酒糖  网址:https://m.xinb2b.cn/sport/ypq205619.html

近日,2022 IEEE 国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition,简称 CVPR)公布论文收录结果。据 CVPR 官网显示,共收到全球范围内 8186 篇有效投稿,其中火山引擎论文《Dressing in the Wild by Watching Dance Videos》(《基于跳舞视频的通用虚拟换装》)成功入选

CVPR 已是计算机视觉和模式识别领域的全球顶级学术会议。根据谷歌学术公布的2021年最新学术期刊和会议影响力排名,CVPR在所有学术刊物中,影响力仅次于 Nature、NEJM 和 Science。

此次被收录的最新研究成果涵盖了计算机视觉的各项前沿工作。火山引擎被收录的论文提出了 wFlow (flow in-the-wild)技术方案,首次解决真实用户场景下的虚拟换装问题。该方案通过 2D 和 3D 信息的结合,可以兼容图片中复杂的人体姿势,背景和服装类型,包括宽松不贴身服装(如连衣裙),同时保持换装结果图片的高清晰度和真实性。

另外,此方案通过一种自监督训练的方式,通过公开可用的人物跳舞视频(经脱敏处理)作为训练数据来实现虚拟换装神经网络模型的训练,避开了难以获得换装结果图作为直接监督的难题。论文中火山引擎构建的 dance50k 数据集后续也将公开供学术界使用。

基于跳舞视频的通用虚拟换装

在娱乐和电商领域,虚拟换装问题有着比较好的落地前景。虚拟换装,简单来说就是在没有实际的人物和衣服的情况下,直接通过算法将参考图片上的衣服,迁移到另一个用户图片中的人身上,从而生成真实的试穿图片。


由于缺乏对人体潜在的 3D 信息感知能力及相应的多样化姿态-衣服数据集,学术界此前很难处理好实际真实用户场景下的数据,只能在一些固定分布的数据集上有相对好的效果。现有的虚拟换装工作局限于简单人体姿势及贴身衣物,极大地限制了其在真实场景下的应用能力。

在 2020 年上半年,火山引擎开始对虚拟换装技术做长线规划并开始长期投入,首次将 2D 像素流与 3D 顶点流相结合形成更为通用的外观流预测模块 (命名为 wFlow),在解决宽松衣服变形的同时提升对复杂人体姿势的适应力。

具体来说,2D 像素流负责构建衣物图片与人体分割图之间的纹理映射关系,其对图片层面的空间结构特征敏感但无法复现潜在 3D 人体的刚性变换,通过进一步引入基于 SMPL 人体 3D 模型的顶点流,通用复合外观流 wFlow 相较现有工作的单一外观流具备更强的三维感知力,同时不丢失了对目标衣服完整 2D 空间结构的保留能力,下图展示了 wFlow 与其他 SOTA 虚拟试穿方法的对比结果。


相较现有工作需要大量人工采集成对衣服-人物数据集进行模型训练,火山引擎通过在跳舞视频上直接进行跨帧自监督训练并对复杂例子进行在线环式优化,实验证明 wFlow 相较现有的单一像素或者顶点外观流方法在真实世界图片上泛化性更高。


可以说,wFlow (flow in-the-wild)技术方案,相比现有方案有更好的视角效果和客观图像质量评估指标,有效提升了虚拟换装的普适性。

论文中,火山引擎新提出的大规模视频数据 Dance50k 相较现有被广泛使用的 DeepFashion 数据集在衣服种类及图片数量上均有大幅提升(见下图)。


同时,火山引擎决定将构建的大规模人物视频数据集共享给学术界使用,以期促进虚拟换装及其他以人为中心的图像生成研究。

未来,AI 技术将越来越多地应用于贯穿 B 端商家与 C 端消费者的整条业务链路,例如在短视频和电商领域:

为短视频特效道具提供技术基础,实现一键换装的短视频特效。用户可以穿着各式各样的服装进行短视频创作,激发创作欲望,丰富后置摄像头的视频创作生态;帮助电商环境下,用户服装选购实现线上试衣,甚至帮助商家生成高质量模特服装展示图,节省成本。

除此之外,火山引擎自研了头部、耳部、足部、手部、腕部、颈部、身体等业内最全面的端上实时人体 3D 感知能力,支持 10 余类商品的实时试穿试戴,提供全平台统一的虚拟试穿试戴解决方案。

疫情当前,线上消费场景需求更多元,AR 虚拟体验成为促进体验式消费升级的重要一环。对于用户来说,能够直接在线上进行商品试用,有助于提升用户的线上消费体验,从而促进商品的购买转化;对于品牌方来说,提供线上的商品及品牌特效互动的能力,这对于品牌推广及购买转化率,都有重要的意义。

借助落地的 wFlow 技术方案,火山引擎开放技术,拥抱合作,希望帮助更多行业用户打造新的营销玩法,实现业务增长。

  • 冷鲜牦牛肉储存方法(牛肉保鲜储藏方法)
  • 2024-09-29牛肉保鲜储藏方法放进冷藏室保鲜把买回来的牛肉盖上保鲜膜直接放入冷藏室保鲜,这种方法只适用于牛肉在1至2天内能够吃完时保鲜用食用盐腌制牛肉保鲜把买回来的牛肉,放入盆里,再把盐撒抹在牛肉上,揉搓均匀,放入冷藏,腌制上3天。
  • 如何快速加入几个两百人的微信群(怎么加入微信群)
  • 2024-09-29怎么加入微信群想要加入一个微信群,每天更新各种群码几百个?有没有什么好的方法呢?本文将为大家介绍几个简单有效的方法1:微信群的基本概念微信群是一个基于地理位置的社交媒体平台用户可以通过这个平台,向其他用户分享信息和。
  • 孕妇多少周能有胎心胎芽(胎心胎芽会在孕几周出现)
  • 2024-09-29胎心胎芽会在孕几周出现对于每一位孕妈妈来说,最开心就好事情莫过于感受腹中宝宝一天天的成长,享受孕育生命的过程随着胎宝宝的长大,会逐渐出现象征胎宝宝生命的胎心和胎芽但是,很多孕妈妈在怀孕期间,都会特别担心自家宝宝的胎心与胎芽。
  • 雅思听力组合词(Hi雅思考试听力词汇巧记忆)
  • 2024-09-29Hi雅思考试听力词汇巧记忆很多小烤鸭反映,听力部分的拼写词汇很容易拼错,背了很多遍也记不准确其实听力词汇的背诵可以根据自然拼读法来记忆,英文一共26个字母,在成千上万的字母组合中,基本发音因素是40余个,所以大部分的听力词汇都。
  • 詹姆士一世介绍(詹姆士一世个人简介)
  • 2024-09-29詹姆士一世个人简介詹姆斯一世,苏格兰斯图亚特王朝第三位国王(1406年—1437年在位,其中1420年—1437年掌握实权)、诗人罗伯特三世之子斯图亚特王朝第一位真实意义上的君主1424年5月2日,挂名国王18年多的詹。
  • rookie发言中文(喷起来喷起来Rookie直播间怂恿观众吵架)
  • 2024-09-29喷起来喷起来Rookie直播间怂恿观众吵架说起LPL的良心韩援,大多人第一时间想打的,应该是IG中单Rookie,作为曾经Kakao的附赠品,加入IG后,Rookie扛下了大旗,在IG状态不佳时力挽狂澜,从一个名不见经传的小角色,逐渐在LPL。
  • 艺术审美与体验的主题有什么(主题的作用和审美价值)
  • 2024-09-29主题的作用和审美价值沅茵我发现好多人写诗歌不在乎主题,有的人甚至认为诗歌反正是跳跃方式,随意无轮次表达,这种写作方式和态度是错误的诗歌的跳跃不是主题跳跃,而是结构跳跃有的人不明白结构跳跃,只认为诗歌内容不连贯就叫跳跃所以。
  • 胡歌20岁和30岁的样子(成为了娱乐圈的一个)
  • 2024-09-29成为了娱乐圈的一个备受关注的《县委大院》,终于定档了,该剧将于12月7日开播汇集了胡歌、吴越、张新成、黄磊、李光洁、刘涛等演员,真是全明星阵容就《县委大院》的预告片来说,剧情立意扎根群众,为百姓服务,格局很大没有美颜滤。
  • 祛痘产品排行榜十强(祛痘美容品牌怎么选)
  • 2024-09-29祛痘美容品牌怎么选  排行榜依靠网络大数据,根据品牌评价和销售量选择了去除青春痘产品的十大品牌,分别是SOR祛痘、攀高、本草、瓷肌、SOR索尔专业祛痘、奥诗娜化妆品、Olay/玉兰油、莱茵、美若康、兰蔻如果你在找青春痘。
  • 山高水长青山不改(咬定青山不放松立根原在破岩中)
  • 2024-09-29咬定青山不放松立根原在破岩中那是石隙中竹子,咬定青山不放松,立根原在破岩中千磨万击还坚动,任尔东西南北风春天,一声春雷,唤醒了春笋他们冲破了泥土,掀翻石块,克服了重重的困难,一个一个从地里冒出来春笋裹着浅褐色的外衣,头上还戴着一。
  • 李荣浩公开求婚成功(李荣浩晒结婚登记照被调侃)
  • 2024-09-29李荣浩晒结婚登记照被调侃这两天,李荣浩杨丞琳领证的事情在网上十分热闹​(李荣浩杨丞琳)先是9月18号,有网友曝光他们两人领证时的现场照,工作室回应:谢谢大家关心然后9月19号上午,杨丞琳在活动采访中回答确认领证终于,9月19。