最近同事小王上班的时候经常踩着脚睡不着觉。本来。她说,下班回家的第一件事不是收拾自己,而是躺在沙发舒适的角落里,掏出心爱的手机,打开短视频app,沉浸在短视频带来的喜悦中,不知不觉0点过去了。
小王说“我没想过熬夜,但神奇的是它们仿佛能拿捏我的口味,推的全是我爱看的......完全停不下来”真有这么神奇吗?(图片来源:pixabay)
随着快节奏的生活和移动互联网的普及,移动短视频逐渐成为人们的移动应用新宠。分析机构数据表明,截止到2018年6月,短视频综合平台的活跃用户达到了4.72亿,而北京快手科技有限公司无疑是这一市场中的佼佼者。
(图片来源:快手官网截图)
神秘推手“现身”!
据了解,目前快手日活用户数量达到了1.3亿,已总计产生了70亿条原创短视频内容。而从每天的使用情况来看,快手用户会产生1500万条短视频内容,视频的日均播放量达150亿次。你就不好奇快手良好的用户反馈背后是什么在支撑?
短视频平台背后的推手就是——强大的AI技术!举一个简单的例子,小编我是个篮球爱好者,当我在快手App上观看过几段和篮球相关的视频后,快手AI平台会推送更多篮球相关的视频给我,甚至其他球类或其他体育项目相关的内容。平台还会对喜欢这类视频的群体进行分析,找到这群人除此之外的共同兴趣点,从而再推送给用户,这也就是小王为什么总是能够刷到停不下来的原因。
目前,快手App的日常运营包括视频内容生产、视频内容理解、用户人群理解、视频匹配分发四个环节,而AI技术已经应用于快手视频从生产到分发到每个环节。
(图片来源:pixabay)
AI让视频生产更有乐趣
相信用过快手的朋友们都知道,快手在视频记录和生成上都运用了许多吸引人的“爆款特效”:
(1)三维人脸技术:就是所谓的“换脸”,除人脸替换外还可以替换成表情包,如果一张绝世美颜安在本编脸上,想想都很刺激。
(2)语义分割:可以对人像进行分割,方便大家进行理想中的特效处理;还可以对头发的分割,可以满足对自我发色有更多要求的朋友。
(3)人体体态估计:这项技术可以对用户在视频中的肢体动作进行识别和定位。
(4)手势识别和检测:顾名思义,就是用于识别用户视频中的各种手势,同时匹配快手推出的各种虚拟动画。
(5)AR相机姿态估计:相信大家对AR并不陌生了,这项技术可以将用户所生产视频内的虚拟物体与真实场景进行融合,可能你会发现没有养猫的你在视频中肩膀上突然多了只猫。
以上甚至更多快手“爆款特效”,背后都是快手运用了非常多的AI算法来让用户生成视频的形式更加有趣。
(图片来源:pixabay)
成熟的AI会自己看懂视频
除了视频生成,内容理解也是快手在 AI 领域的核心技术之一。一个成熟的AI,当然会自己看懂视频啦!当用户视频上传成功后,快手的AI技术会通过给视频贴标签和语音识别与合成的方式帮助机器理解视频内容。
视频标签包括识别人物和场景(人物包括人体和物体),像是一种男左女右的自觉性。而语音识别与合成方面,则包括了视频语音转文本和语音合成两个方面。由于部分视频图像并不能很好地向人们展现发布者想传达的信息,此时,快手AI平台会把语音识别出来转化成文字,也会通过语音去识别这个人的身份、年龄、性别等等。
(图片来源:pixabay)
成熟的AI知道你想看什么!
我们都知道,快手App一个面向普通大众的社区,目前日活用户数量达到了1.3亿,用户群非常庞大。因此快手AI会对用户进行理解,它会先通过对用户观看视频的内容进行理解,并结合用户所处位置、观看习惯及兴趣方向进行综合分析。当你再次打开快手时,将得到与你兴趣方向为之匹配的视频内容推荐,这就是快手的魔力!
(图片来源:pixabay)
当然,无论是哪个环节,短视频应用背后的 AI 平台,都需要对用户上传的视频进行有效的分析和感知,而图像和语音是其中两个核心维度。目前,大量的迭代计算让快手AI平台开始经受严峻考验。为此,英特尔团队一边帮助快手对其算法进行优化,一边为快手 AI平台提供的新一代英特尔®至强®可扩展处理器,使快手 AI 平台的性能增至原有的 2.22 倍,令快手AI平台在处理海量图像数据时获得更优性能。
同时,对海量视频内容进行精准的语音识别让其AI平台压力倍增,为帮助快手 AI 平台进一步提升在语音识别上的工作效能,除引入新一代的英特尔® 至强® 可扩展处理器外,还为快手提供了英特尔® MKL和高性能编译器,处理性能可提升至优化前的 1.92 倍到 2.46 倍不等。
可见,英特尔对快手AI平台的优化让记录形式更有趣,让机器理解视频内容、深度洞悉用户,为用户带来更强烈幸福感。快手公司多媒体内容理解部负责人李岩表示,快手的愿景,是以科技实现每个人独特的幸福感。现在,快手与英特尔的工程师们正携起手来,以先进的产品与技术为这一愿景添砖加瓦,共同帮助大家记录和分享每一刻美好!