#本文为人人都是产品经理《原创激励计划》出品。
不知不觉中,AI技术已经渗透了我们的生活,比如短视频平台就有AI/AR道具,创作者可以利用这一类道具来创造更有趣的内容。具体而言,有哪些AI技术可以应用在内容类型产品中、增加创作的多样性?不妨来看看作者的总结。
最近因为工作原因接触到了快手的AI技术(主要是CV方向的),也跟快手的技术团队做了一些访谈。不由得感叹其实快手的技术还是非常领先的,甚至很多场景做得比抖音还要早,技术单拎出来比字节的技术更加能打、更加领先。
但是为什么AI技术如此出众的快手却在大众市场上或者是我们谈的商业市场上不如抖音呢?互联网的竞争如此激烈,原则上在占用用户时间的维度上大家都是竞品,人们知道字节的轻颜、剪映、醒图,但是很少人知道快手也有对标的一甜、快影和原片。
图1 快手头条有一系列对标的竞品
首先需要澄清的一点是,AI技术并不是万能的。很多商业上的成功,并不代表这家公司只是因为技术很厉害、算法很牛逼,商业上就一定很成功,这个不是充分必要条件,技术很牛逼最多只是一个充分条件。
商业上的成功,或者是我们世俗定义的成功,更多还包括组织上的成功(人才的管理、激励,组织协同工作、效能最大化)、产品的成功、对于人性的洞察与应用,对于商业模式的理解等等,这些全部要素才能最终使得一款产品真正地走向成功并且生命周期足够长。
比如说微信就是一个很典型的例子,微信有AI技术么?当然,但这些都是润物细无声的存在,微信并不会为了AI而AI,比如微信扫一扫入口识图、识街景、识商品/长按翻译/语音转文字等,这些都是AI技术能力产品化,但是这些并不是微信这个产品的全部,或者说,这些技术只是帮助微信更好地向用户提供一个交流沟通的工具,让人们更加无障碍地交流互动。
问一个问题,对于抖音或者快手来讲,大部分人是刷视频还是调用摄像头主动拍摄视频呢?
相信大家的答案应该是一致的,大部分人用抖音快手还是用来浏览,kill time。真正使用抖音里面的各种AI/AR道具UGC创作内容的还是少数,大部分用户如果使用道具可能是尝鲜,比如一些拍同款;对于专业的内容创作者,主要是通过内容本身的编排设定来吸引观众,也不太依赖于AI的模板或者是各种道具。即使需要使用AI的各种剪辑等特效技术,可能也是在视频创作过程中使用,即作一个AI赋能的视频编辑工具,比如类似剪映。
但是问题又回到了起点,为什么快手很多的gan(对抗生成网络)等AI生成技术比抖音好很多呢?头条不是算法起家嘛?通过近一周多时间仔细分析两家公司的背景,尝试得出的原因总结如下:
1)基因使然
快手最早是从动图gif剪辑工具起家,本身就是一家技术驱动型的公司,且创始人宿华和程一笑也都是技术出身,因此营造工程师的乐园,重点在CV等技术上加大投入,用技术来驱动产品,通过一些AI加持的爆款特效 专题运营来激发用户活跃度;这个是快手这家公司的底层逻辑。
2)老铁需求
快手本身的平台特质跟抖音就有很大区别,抖音是符合马太效应的,即主要的80%流量都导向头部的20%网红,而网红生产的内容是通过抖音大数据平台算法得出的。
快手则相反,致力于构建一个公平的平台机制,如果流量太高反而会被限流,更多的鼓励是平民生产内容,构建同城或者是你身边跟你很相似的人的故事。这些人可能就与你我一样是个普通人,背后没有MCN机构、没有巧妙构思的脚本、专业的剪辑,因此这些“平民”需要AI加持、需要一些工具来低成本地创造内容,记录自己的生活。
从这个角度来讲,快手更需要更加强大的内容创作生成技术来帮助普通人实现明星梦,或者是拍同款。
虽然AI技术不是万能的,短视频的核心还是内容为王、围绕内容构建各式各样的玩法;但是通过AI技术加持,帮助大家高效地生产内容、创造有趣的、好玩的内容,所以接下来想谈谈,具体有哪些AI技术是可以应用在内容类型产品中的。
一、物体/动作检测技术这一类应该是最早应用在短视频内容创作上的,包括很多自拍相机也有类似的功能。比如眨眼睛、吐舌头、比各种手势来触发一些特效,这些是基于人脸的。同理,基于一些生活中的图标、物体检测来触发一些特效。
图2 比心特效
二、美颜、美妆、美体、美牙等人像美化功能这些其实都是基于关键点技术,无论是人脸的关键点检测还是人体的关键点检测技术,不论是5点、21点还是137、200 、1000 的点,又从2D的关键点到3D的关键点,这里都是为了帮助机器确认人脸的五官位置以及面部轮廓来进行的比例调整,比如大眼、瘦脸、瘦腰、拉腿等等。
这些比较基础,对于关键数量依赖比较少。如果想要做得更加精细,比如美妆里面需要进行眼妆(睫毛、眼影、眼线、眼睑下至、卧蚕)等等小部位的刻画,这就需要关键点数量的增加,甚至如果想要做丰额头、高鼻梁、低颧骨、丰苹果肌等效果,就需要一些3D mesh(从原来的点形成网状结构)的辅助。
图3 2D人脸关键点和3D关键点,人像美化的最基础技术
图4 人体关键点技术
又或者是如果在美体这个用户体验做到既可以拉腿、细腰、丰胸,同时又不让背景畸变,就需要引入matting和inpAInting的技术了(既抠图和补全),有些场景下也可以使用3D人体重建的技术。比如说剪映软件里的换背景功能也依赖于抠图能力。
牙齿美白、口红依赖于分割技术,比如我最近在使用剪映牙齿美白功能的时候,嘴巴前面有一个遮挡物时,就会在遮挡物上就浮现了一个白色的月牙状不明物体,这是因为牙齿没有像嘴巴一样做遮挡状态的判断,呈现了一种俗称“穿帮”的画面,非常尴尬。
三、AR类(人和环境)所谓AR类的,我们统一都定义为在已有的现实空间中叠加3D渲染的CG素材,不论是叠加在人脸上的、还是叠加在环境中的。
这些底层技术一部分依赖于3D的人脸关键点的定位技术,另一部分依赖于对于空间的3D定位技术,如何在不同的用户手机姿态运动下、用户本身做各种动作的情况下,能保证叠加3D素材的绝对位置的固定(因为现实生活中的物体都是绝对静止的、不会随着手机的运动而动来动去),这个是对于技术考验最大的部分。
当然3D素材的精致程度,很大程度也依赖于CG的生成效果。
图5 google基于Android像开发者提供的ARcore能力,对标的苹果有ARkit
同时,这类型的技术还非常适合跟广告主结合,广告主通过某个主题的风格或者元素,平台推出、大V优先使用引发网友参与最后形成二次传播,使得品牌的产品及形象在网友中引发广大的讨论。
比如在ins上,Gucci、LV、Dior就订制了很多富含自己品牌元素的AR贴纸套装供用户使用,用户在拍照录视频玩的同时,也可以体验产品虚拟试穿、试戴的效果,进一步促进购买转化。
图6 ins上的gucci lens(特效)
四、生成类网络(GAN)随着蚂蚁呀嘿的一夜爆火,zao等AI换脸引发社会广泛伦理道德的讨论,社会对于GAN生成类的特效一直有很高的热度,比如说“变三岁”、当你老了、迪士尼风、国漫风、手绘小姐姐等等。
由于GAN本身网络的特性就十分适合短视频这类、以内容生产作为主要驱动力的产品定位,通过使网络学习大量的目标图片的风格,AI技术结合一些短视频类的模板就可以非常快速地帮助用户生成非常搞笑的、可爱的、炫酷的短视频内容,也非常适合结合短视频平台的各种节日运营活动展开,比如万圣节生成鬼怪妆容、儿童节生成儿童脸,520/情人节“变男友”等等。
图7 快手平台520活动变男友,应用的就是GAN网络生成有夫妻相的男友
虽然在任何时代,内容为王此话不假,但是在所有UGC的平台都已经被AI深度渗透、成为不可或缺的一部分的时候,你的产品没有反而无法留住用户。此时的AI技术在Kano模型当中已经从一个魅力需求变成了一个基础需求。
据内部消息,小红书已经大规模高薪聘请CV算法工程师来帮助提升其平台内容的AI多样性,你认为这必要么?
作者:大仙河,7年AI产品相关经验;微信号 :大仙河知识学堂
本文由@大仙河 原创发布于人人都是产品经理,未经许可,禁止转载。
本文为人人都是产品经理《原创激励计划》出品。
题图来自 Pexels,基于 CC0 协议
分析抖音快手的商业模式(快手背后的技术)
2024-11-25 05:11:46 作者:新诗旧梦 网址:https://m.xinb2b.cn/life/fvt227470.html
- 数学思维训练题骰子(数学思维训练掷骰子游戏)
- 2024-11-25数学思维训练掷骰子游戏小学数学除了要加强常规计算训练以外,锻炼解题思维也是一项很重要的基础训练上一期数学思维训练课程的题目是数学思维训练——解开密码锁主要训练了孩子们的逻辑思维能力,锻炼孩子们利用假设、推理,进行矛盾判断,。
- 每个故事都有一个难忘的瞬间(曾经有一份美好的记忆)
- 2024-11-25曾经有一份美好的记忆#头条故事会#今天要讲的事,关于爱情,关于喜欢,关于暗恋!我和小丽相识在初中那年她转学到我们班上同学们对新来的同学都有种好奇第一眼看见她的时候我就被深深吸引喜欢她的文静和淡雅总是有意无意的了解她、走进。
- 恒驰5作为纯电a级suv代表(关注终于来了)
- 2024-11-25关注终于来了文:懂车帝原创李德喆[懂车帝原创行业]2月11日,懂车帝获悉,工信部网站发布的第353批《道路机动车辆生产企业及产品公告》车辆新产品公示清单中,恒大汽车首款车型恒驰5赫然在列恒驰5进入第353批《道路。
- 和父母住一起太累了(跟父母住一起是什么感受)
- 2024-11-25跟父母住一起是什么感受小时候和父母住一起,读书了和父母住一起,参加工作了和父母住一起,结婚了,还和父母住一起!可以说,我这四十年基本没有离开过父母,除了在校读书的时候.都说家有一老,如有一宝!按这么说的话,我是幸运的,家里。
- 虐杀原形2有没有像第一部(游戏史上的今天)
- 2024-11-25游戏史上的今天回顾游戏历史,重温青春时光Hi,大家好,我是比比代巴比代布(活蹦乱跳)~今天是2018年7月24日(忙碌的一天开始啦),游戏史上的今天发生了哪些事情呢?2012年7月24日《虐杀原形2》发售《虐杀原形。
- 92岁传媒大亨默多克第四次离婚(88岁默多克购亿元爱巢)
- 2024-11-2588岁默多克购亿元爱巢美国传媒大亨鲁伯特·默多克(RupertMurdoch)是世界新闻界的大佬,拥有世界上最大的跨国媒体集团,是享誉全球的亿万富翁,同时也是美国华裔名媛邓文迪的前夫,2013年两人离婚后,默多克与名模杰莉。
- 藠头和蒜头葱的区别是什么(藠头和蒜头葱的区别有哪些)
- 2024-11-25藠头和蒜头葱的区别有哪些首先从鳞茎形状说起薤白的鳞茎是“近圆球形”的,而藠头的鳞茎是“卵形或狭卵型”的,用大白话说,就是一个扁一个长而已其次,两者的鳞茎皮颜色不同薤白“鳞茎皮外层的带黑色,易脱落,内层为白色”而藠头“鳞茎皮白。
- 轴承有几个编号(轴承编号手册可以收藏了)
- 2024-11-25轴承编号手册可以收藏了导读这是一部轴承小手册,概括了轴承的代号分类,当你看到这篇的时候,也许有些代号目前你并未接触,但我相信,只要你是轴承人士,在今后一定会有需要它的一天!轴承的分类从左往右数第一个或第一个和第二个数字加在。
- 我们都在等唯一契合的灵魂是什么(我们都在等唯一契合的灵魂)
- 2024-11-25我们都在等唯一契合的灵魂此图来自于网络人生皆过客,我们生命中会遇到过形形色色的人,大多都聚散两匆匆,终归无缘你是否也如我一样在等待一个与自己灵魂唯一相契合的人?曾经看过这么一个故事:“在地铁站,一个肩背背包的帅气的男孩,当疾。
- 失利和失败的区别(失利和失败有哪些不同)
- 2024-11-25失利和失败有哪些不同两者的含义不同失利:打败仗;战败;在比赛中输了,吸取战斗失利的教训,以利再战失败有两层含义,首先在斗争或竞赛中被对方打败(跟“胜利”相对)其次工作没有达到预定的目的(跟“成功”相对)两者的程度不同失败。
- iphone 怎么搞壁纸会动(iPhone壁纸这样设置晃动手机有)
- 2024-11-25iPhone壁纸这样设置晃动手机有相信不少iPhone用户都会给手机换上好看的“墙纸”,今天我就教大家一招让iPhone的壁纸更有个性,更有逼格,快来看看吧!1、我们进入【设置】-【墙纸】-【选取新的墙纸】,然后从相册中选择自己喜欢的。
- 韩国当艺人到底有多可怕(韩国忙内文化令小字辈苦不堪言)
- 2024-11-25韩国忙内文化令小字辈苦不堪言来源:环球时报【环球时报综合报道】韩国是一个注重年龄和辈分的国家在一个团体或者家庭里年龄最小的成员韩语中被称为“忙内”中国的老幺往往是最受宠爱的孩子,韩国的“忙内”虽然受到长辈的宠爱,但作为整个“食物。