欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  新闻

百度搜索引擎千人千面的转型之路

程序员文章站 2022-06-30 23:52:41
腾讯没有梦想,阿里没有盟友,百度没有文化……去年一系列对互联网巨头的灵魂拷问没有在2019年结束,这一次的主角还是百度。...

腾讯没有梦想,阿里没有盟友,百度没有文化……去年一系列对互联网巨头的灵魂拷问没有在2019年结束,这一次的主角还是百度。

1月22日晚间,一篇题为《搜索引擎百度已死》在朋友圈刷屏了,文章指出百度搜索结果一半指向自家的内容平台百家号,充斥着大量营销号和真假难辨的劣质内容,认为「作为搜索引擎的百度已死」。

百度搜索引擎千人千面的转型之路

这一观点也引起了不少争议,有人深有同感,「百家号简直三观不正道听途说指鹿为马」。微博 ceo 王高飞则认为百度只是把「搜新闻」这个需求做成了内生化。

在百度角度,腾讯/头条的资讯搜索都是内生的,凭啥百度要做开放?今天上午百度也对这篇文章作出回应,称百家号在全部搜索结果占比不到 10%。但百度搜索对百家号的流量倾斜也是事实,去年3月百度曾在给站长的一封邮件中宣布「2018-2020 年 80% 搜索流量将全部分布给优质熊掌号」。

百度搜索引擎千人千面的转型之路

作为一个搜索引擎,到底应不应该利用自身在搜索市场的主导地位,来为自家的服务和平台导流。

而在移动互联网时代,信息被各种 app 分割成一座座孤岛,搜索不再是人们从网上获取信息的第一入口,这种背景下搜索引擎应该给用户提供什么内容。

这些都是所有搜索引擎,更是转型中的百度必须要思考的问题。

从搜索引擎到「流量工厂」,百度是怎么想的

其实百度搜索中早就存在信息流,不过搜索框和信息流是分开的,这次直接将搜索结果中导向百家号,加上百家号的内容生态确实还不够成熟,不可否认会对用户体验造成影响。

百度搜索引擎千人千面的转型之路

跟过去一直被诟病的竞价搜索一样,百度在商业化和用户体验之间选择了前者。

过去百度将搜索的流量直接变现,如今则用搜索的流量扶持自己的内容产品,这是头条系常见的打法,这一变化也与百度的信息流布局有关。

百度搜索引擎千人千面的转型之路

内容来自百家号

信息流和 ai 是陆奇担任 ceo 时为百度定下两大主航道,在陆奇离开后,信息流依然是百度重点押注的一个方向,百家号就是百度其中一个信息流产品。

早在 2017 年手机百度信息流用户月活就超过 1 亿,虽然信息流在百度营收中占比不多,但去年第三季度信息流广告的增速已经超过搜索广告。这两年百度其实已经不是一个纯粹的搜索引擎,而是奉行「搜索+信息流」的双引擎模式。

这背后是互联网广告格局和信息分发模式的改变,这两者都与移动互联网的兴起有关。

搜索广告一直是百度最主要的收入来源,2012 年三分之一的网络广告份额都被百度搜索占据。但随着移动互联网普及,搜索引擎开始式微,不复 pc 时代的辉煌。

百度搜索引擎千人千面的转型之路

▲图片来自:艾瑞咨询

根据艾瑞咨询的数据,移动广告规模占网络广告的比例近 70%,而搜索广告的份额持续下降,而信息流广告则保持着高速增长,收入突破千亿大关。

另一方面,移动互联网也改变了用户获取信息的方式,从主动搜索到在社交媒体等应用中获取,基于算法的分发已经成为主流。

大量信息散落在公众号、头条号和百家号等碎片化的平台中,而搜索引擎也不能再通过爬虫来聚合这些内容。

搜索广告越来越不值钱,信息流越来越受青睐,百度当然大力推广信息流。而信息的孤岛化又让综合搜索的价值打大折扣,不如用这些流量扶持信息流产品,换取更大的价值,只从商业角度考量这似乎无可厚非。

2016 年百度信息流业务上线,百家号和也在这一年上线,信息流广告从跟凤巢推广搭配投放,到 2017 年设立单独产品线,对信息流的资源倾斜已经很明显。

随之而来的是信息流商业变现的压力,据腾讯《潜望》报道,百度去年曾把信息流已调高至 300 亿,而 2017 年百度信息流业务营收还不到 100 亿元。

要维持这样高的增速,百度搜索的流量倾斜是个能短时间见效的方法。

搜索引擎百度死了吗?

百度用搜索给自家产品导流,是不是有「既当裁判员又当球员」的嫌疑,这样的质疑从百度贴吧推出时就开始出现,这个问题归根结底就是搜索引擎究竟应不应该保证搜索结果的公正,也就是所谓的「网络搜索中立」。

与过去对于百度搜索竞价排名近乎一边倒的批评不同,这次有不少舆论认为百度这样做无可厚非,毕竟腾讯和字节跳动等公司也都是这样为信息流产品导流的,百度为什么就不能呢?

百度当然可以,但作为搜索引擎的百度就不一定了。在桌面互联网时代,搜索不仅是人们进入互联网的第一入口,也是连接各个网页的枢纽。

作为互联网的重要入口,搜索引擎虽然蕴藏着极大的商业价值,但是如何让用户快速准确地找到所需信息才是立身之本,也是核心竞争力。

百度搜索引擎千人千面的转型之路

google 的诞生就是基于 pagerank 算法,1998 年 larry page 和 sergey brin 在一篇论文中解释了 pagerank 的核心理念,如果一个网页被很多其他网页所链接,说明它受到普遍的承认和依赖,那么它的排名就高。

编者注:pagerank 中的 page 取自创始人 larry page ,而不是网页的意思。

这一算法被认为是*表决式的网页排名技术,给互联网中的网页建立了一种新秩序,后来 google「不作恶」的座右铭其实也是与 pagerank 的理念一脉相承。

可惜 pagerank 的初衷并没有在 google 搜索中完全实现,虽然竞价排名机制跟百度不完全一样,但对搜索结果的干预是不可避免的。

去年美国总统特朗普还曾在 twitter 上发文指责 google 操纵关于他的的搜索结果,刻意隐藏正面新闻,找到的都是负面新闻。

而且如今 google 也在搜索引擎中加入自家的信息流产品「google discover」,形态跟手机百度中的信息流类似,包含了图文和视频等内容。

百度搜索引擎千人千面的转型之路

尽管 google 没有直接将搜索结果导向信息流内容,但也不避讳类似的操作。2017 年 7 月 欧盟给 google 开出 24.2 亿欧元的天价罚单,主要原因就是 google「通过对其搜索服务的主导地位,引导用户使用自己的服务」。

负责调查 google 垄断案件的 margrethe vestager 表示,调查团队在 google 进行 17 亿次搜索后发现,用户搜索时会优先显示 google 的产品和服务,竞品的信息通常要到第 4 页才出现。

这显然违反了「不作恶」的原则,但不可否认 google 依然是目前最好用的搜索引擎,能满足大部分搜索需求。

正如那篇文章说,百家号内容确实参差不齐,起码我自己也已经很久不用百度搜索新闻资讯,但资讯类搜索也不能等同于整个百度搜索的价值,由此推导出「搜索引擎百度已死」也有失偏颇。

再者,以「搜索中立」的标准来要求任何一家搜索引擎其实并不现实。

搜索中立可能是一个伪命题

搜索引擎到底应不应该主动干预搜索结果?这似乎是个两难的问题。

百度过去那些莆田系等竞价医疗广告说白了就是在「作恶」,终于酿成了魏则西的悲剧。但是放任不管也有问题,去年百度首页推荐出现滴滴安全事件遇害者照片相关内容,百度很快就回应称内容审核还不够强,言下之意要进一步加强对搜索结果的干预。

百度搜索引擎千人千面的转型之路

很多时候「搜索中立」只是一种乌托邦式的理想, google 副总裁 marissa mayer 就曾撰文表示网络搜索中立不现实。

搜索引擎利用算法和等式在网上生成顺序和组成,手工操作做不到这一点。这些算法包括决定哪条信息是「最好」的规则,以及衡量的方法。很显然,要确定哪种产品或服务是最好的,这一过程中存在主观性。

诺贝尔经济学奖得主 kenneth arrow 在上世纪 50 年代曾提出过一个「阿罗不可能性定理」(arrow’s impossibility theorem):

对任何一种排序机制来说,当排序对象有三个或三个以上时,排序结果不可能永远同时满足给定的几个公正性条件。

在移动互联网普及前,互联网的海量和多样信息已经倒逼 google 等搜索引擎不断优化搜索算法,这本身就是对搜索结果的一种干预。而在信息被割裂在一个个 app 的现在,如果沿袭过去的模式也未必能更高效。

百度搜索引擎千人千面的转型之路

但这并不意味着搜索引擎可以无视任何原则,一切取决于能否为用户带来价值,就像康奈尔大学法学教授 james grimmelmann 在一篇讨论「搜索中立」的文章所说的:

关于搜索的中立性,有一点是毋庸置疑的:搜索是用户的自主行为。一个好的搜索引擎,应该比任何一种通信技术都更加着眼于用户的利益。

所以对于搜索引擎来说,真正的问题应该是:是否有什么结构性的力量会妨碍到提升用户的自主性?

那些搜索中立的拥护者,实际上是将网站利益置于用户利益之前。但是,网站通常不是用户的朋友。在某些情况下,它们是;但更多时候,网站需要流量,并会不惜任何手段来抓住用户。

搜索引擎到底应不应该干预搜索结果,这可能是个不需要考虑太多的问题,关键在于怎么去干预。百度是最大的中文搜索引擎,如果把商业变现建立在践踏用户体验的基础下,也无异于饮鸩止渴,「搜索引擎百度已死」将成为一个预言。

在 2019 年第一个工作日,李彦宏在百度内部信中表示:

那个能够做出好产品、那个受用户喜爱的百度,已经回来了!

嗯,还真是。

百度搜索引擎千人千面的转型之路

来源:爱范儿 作者: 李超凡