\ & ampquot年收入800亿美元,他的秘密是.& ampquot
\ & ampquot在网上生活了一年多,她的秘密是.& ampquot
\ & ampquot震惊!不知不觉中,你在这个网站上花了20倍的时间!\ & ampquot说
本来这篇文章题目应该是这三个中的一个,更吸引眼球,更符合普遍读者的兴趣,肯定更容易传播。(莎士比亚)。
但我们还是想与本篇主题——「推荐系统」做个游戏,在个性、「个性化」与数据之间,寻找一点机器暂时无法理解的乐趣。
一、推荐系统做得好,收入用户跑不了
「800 亿美元」的主角是 Alphabet(Google 母公司)。
2016 年,Alphabet 的广告收入为 794 亿美元,牢牢占据全球媒体广告收入第一名。排在第二的是 Facebook,第三名是传统媒体 Comcast(美国康卡斯特电信公司),129 亿美元的收入还不到 Alphabet 的五分之一。
为什么 Google 能在广告上获得如此高的收入,将其他竞争者远远甩在身后?
2003 年上线时,Google 的广告系统还是以用户键入的关键词(query)为出发点,通过匹配、分析点击数据提升效果的广告系统。十几年间技术更迭,如今已经变成了拥有上千亿特征的庞大的机器学习系统。
Google 的广告为什么不会令人反感?在基于个人、广告和关键词的千亿特征之间,推荐系统努力将真正可能感兴趣的商品、服务的广告呈现在你面前。学习用户点击行为的反馈数据后,推荐系统还可以不断提升广告的准确度和转化率。现在,Alphabet 70% 以上的营收来自广告。支撑一个近万亿美元市值的互联网帝国,推荐系统功不可没。
「上线一年日活超千万」的主角是抖音。
自去年 9 月上线以来,抖音的日均活跃用户数已超千万,迅速从 2011 年诞生的老前辈「快手」手中抢得一片天地。在上周的今日头条段视频营销峰会上,官方给出的数据是抖音的日均播放量已经超过 10 亿。
为什么抖音有毒,一刷就停不下来?
通过收集用户点赞、分享、上滑(不喜欢)、观看时长等数据,抖音不断分析着用户的行为喜好。配合使用今日头条时已有的用户画像和庞大的用户基数,在推荐系统的帮助下,抖音可以不断将「真正感兴趣的内容」推送给你,实现「像素级的个性化」让你上瘾。
「花掉 20 倍时间」的主角是 YouTube。
2015 年,YouTube 开始使用基于深度学习的推荐系统。从基于搜索的「视频网站」,到依赖「频道」订阅的「电视台」,再到现在的「个性化主页」,10 年间 YouTube 一直在改变。现在,YouTube 用户在线观看时长与三年前相比整整提升了 20 倍,其中 70% 都来自算法推荐。
把你需要的交给你,这就是推荐系统,一项影响着我们每个人的技术。
二、猜测你,猜测一颗暧昧的心
顾名思义,推荐系统就是向用户推荐感兴趣或者需要的商品及内容的系统。
并不会沟通的机器,如何了解你的喜好?只能通过一些不那么明显的信息——你的历史行为、社交关系、兴趣点、所处上下文环境等等,试着将你感兴趣的内容找出来。淘宝的相似商品,豆瓣的「喜欢这部电影的人也喜欢」、甚至今日头条整个产品,都是推荐系统的表现形式。
最早人们使用的是基于内容的推荐方法(Content-based Filtering),即根据物品(item)的属性为它们打上标签,通过标签计算它们之间的相似度。用户只要选择一种物品,机器就会推荐出与之类似的物品。最早采用这种方法的是亚马逊,当时这种方法帮他们卖掉了不少书。
当你浏览《正义联盟》页面,豆瓣推荐的都是超级英雄电影
不过基于内容的推荐方法有着显而易见的缺点。一旦我们已经购买了某种物品,并不需要更多类似的东西。还有很多东西我们的确需要,只是没有表达或者不知道该如何表达出来。
于是人们提出了协同过滤方法(Collaborative Filtering)。就像日常生活中我们会让兴趣相投的朋友推荐电影或者音乐,协同过滤的做法是通过行为、标签等数据找到与你相似的用户,通过他们的行为和他们喜欢的内容,为你推荐你可能感兴趣的物品或内容。
除此之外,Spotify 还会使用自然语言处理技术分析社交网络、网页中的文字内容,以此判断作品之间的联系进行推荐。使用深度学习技术的 YouTube,还能找到内容之间人类难以发现的联系。
互联网中沉淀了大量有用的、适合你的信息,只是通过搜索引擎很难表现出来。这些信息就像一座冰山,搜索让我们看见水上的部分,推荐系统则尽量将水下庞大的体积盘活,让那些没被注意到的部分浮出水面。
三、搜索向左、Feed 流向右,欢迎来到「有毒」时代
马太效应(Matthew Effect),指强者愈强、弱者愈弱的现象。
长久以来无论电商销售还是新闻传播,互联网一直因马太效应而受诟病。
也许我们不该将责任推卸给互联网。趋从热点、希望了解他人已经了解的事物是人的本能,了解他人不了解的事物、追求个性与不同同样是人的本能——也许只是这部分需求暂且没有被满足。
Chris Anderson 早早就注意到了这个特点。2004 年他在《长尾理论》中表达了自己的观点:当商品储存、流通、展示的场地和渠道足够宽广,看似需求极低的产品只要有卖都会有人买,其所占的市场份额甚至可以超过热卖品。
亚马逊的线上图书销售状况证明了长尾理论的合理性,「那些过去根本卖不动的书,现在要比畅销书卖得多」。
信息同样如此。爱玩社交网络的你一定已经发现,过去一年不论新浪微博还是 Instagram,信息流中的内容被强制变乱了。与此同时,百度在首页增加了新闻信息流,就连工具产品 UC 浏览器,也早早把自己变成了信息流产品 UC 头条。
为什么大家都盯上了个性化 Feed 流(即我们通常所说的「信息流」)?
从基于搜索的、到基于信息的,「Feed 流」改变了用户需要强驱动才会主动获取信息的行为模式,只需要被动选择自己想要的;从基于时间的、到基于兴趣的,「个性化」将原本因为时间被刷掉、用户本应感兴趣的内容重新呈现在人们面前。
你也可以用不感兴趣,调教属于自己的推荐系统
虽然你可能并不喜欢主页的杂乱无章,但社交网络产品的用户和留存时间的确在大幅上升。2017 年二季度财报显示,新浪微博月活跃用户数为 3.61 亿,较上年同期增长 28% ;日均活跃用户数为 1.59 亿,较上年同期增长 26%。
2013 年,Alexis Madrigal 曾在《大西洋月刊》的一篇文章中写道:「Feed 的巅峰时刻已经过去……没完没了的内容流服务会让人感觉精疲力竭。」
显然他没有意识到推荐系统的巨大魅力。只要推荐得足够好,用户的时间就像挤不干的海绵,永远都有。
2000 年代的广告系统,2010 年代的 Feed 流,推荐系统的下一个爆发点在哪儿?
四、教育、金融、招聘……你能想到的垂直领域都有它
也许是各个垂直行业。
比如教育。通过切入作业场景,根据学生的答题状况进行画像,教育类应用就可以推荐适合学生的题目和需要巩固的知识,阿凡题、猿题库、作业盒子都已经部署了类似的个性化教育系统。
比如金融。通过分析以往沉淀的用户数据为用户画像,再根据市场和环境的变化推荐合适的理财产品,推荐系统相关技术早已被各大银行采用。
再或者招聘、寻找伴侣。除了根据求职者的情况推荐合适的工作,招聘类应用也在根据雇主的需求推荐合适的候选者;世纪佳缘等相亲类产品自不必说,Tinder、探探等交友产品早早就应用了推荐系统。不然,是谁来找出那些你可能感兴趣的用户呢?
只要有用户、有个性化的需求,就有推荐系统的用武之地。
据某信息流产品负责人称,「年初 50 万年薪还能招到合适的推荐系统工程师,现在 100 万都找不到」。
这是推荐系统的黄金时代,也是推荐系统工程师的黄金时代。
同样是属于用户的黄金时代。丛林里的鸟唱了一首绝妙的歌,如果没有被人听到,这歌声就不存在了吗?推荐系统正在让我们听见这歌声,看见更多原本被忽略的事物。
也正是因为推荐系统,才让我们在浩如烟海的信息世界中相遇。
题图来自网络。
本文及文中图片为「KnowingAI 知智」原创,未经许可,请勿转载。