欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  网络运营

新兴搜索引擎网站DuckDuckGo的崛起之路

程序员文章站 2022-03-29 10:21:19
这篇文章主要介绍了新兴搜索引擎网站DuckDuckGo的崛起之路,文中主要对DuckDuckGo在隐私政策方面的突出点作了介绍,需要的朋友可以参考下... 16-01-07...

2008年 的时候如果说还有人想做一个搜素引擎来挑战 google,你一定会以为这个人是疯了。微软、yahoo 等昔日的巨头都已经失败过的事情,还有谁敢干?

mit 研究生毕业的 gabriel weinberg 就是这样的人,尽管失败是他的家常便饭。他前后创业了两家公司,一家失败,另一家后来也卖给了别人,随后又折腾过结构化数据、quora 式的问答网站以及反垃圾邮件技术,均未获成功。

微软、yahoo 失败的原因,大抵是因为它们沿用的是 google 同样的做搜索的方式—包括对 web 进行大规模的索引等一些做法。而 weinberg 失败的原因,也许是因为他没有把失败的东西糅合到一起。

于是他这么做了,三个失败的尝试,结构化数据 +quora 式的问答网站 + 反垃圾邮件技术产生的化学反应足以化腐朽为神奇。尽管目前从体量上来说,duckduckgo 也许还是 google 的一个最微不足道的竞争对手,但从下图它陡峭的搜索流量增长曲线来看,未来也许它会成为搜索巨头最强悍的竞争对手。

秘密武器:以尊重隐私为核心

不过三合一还不是 duckduckgo 流量飙升的主要原因。duckduckgo 最陡峭的坡是从去年7月 开始形成的,这正是斯诺登披露 nsa 棱镜计划的时候。棱镜事件成为 duckduckgo 的一个绝佳的营销工具,因为保护隐私正是后者的核心理念。

跟其他的搜索引擎不一样,duckduckgo 的查询不需用户账号,默认情况下不记录 ip,也没有搜索 cookie 跟踪用户搜过什么,在网上逛过什么地方,duckduckgo 不会保留用户的搜索历史,用户点击 duckduckgo 搜索结果上的链接时,目标网站也看不到用户使用的搜索词,duckduckgo 甚至还配备了自己的 tor 出口中继,帮助 tor 用户提高搜索性能。

不过,尽管 weinberg 很在意隐私,但一开始并不是很重视,是那些偏技术重隐私的早期用户提出相关问题才让他把保护隐私作为了产品的核心的。

对于任何胆敢挑战巨头的初创企业来说,被巨头山寨是最大的风险,巨头只需抄袭你与众不同的东西,其巨大的影响力足以将卑微的你扫进技术史的垃圾桶(看看被腾讯扼杀过的初创企业有多少就知道了)。

weinberg 和他的小伙伴们似乎毫不畏惧。因为 duckduckgo 的这样东西是 google 复制不了的—不要那些隐私数据,google 的定向广告也就无的放矢。因此,duckduckgo 俨然找到了自己的独特卖点,并随着公众对网络隐私的日益重视而持续发酵。


选用duckduckgo不仅仅可以看做是一种技术上的选择,而且也是一种对全面革新的支持。在一个并不是为了爱和友谊,而是为了更加有效地将你卖给广告主才去深入了解你的时代,ddg将自己定位为另辟蹊径不做跟踪的隐私权之守护者。 当然你仍旧要被货币化,但会以一种更加文明和匿名的方式进行。
突出隐私权是个好办法,可藉此找出同google等搜索引擎相比的竞争优势,因为别的搜索引擎明显在隐私权方面毫无竞争能力。这个我明白。但我发现更值得关注的是ddg在来自大众的(crowdsourced)插件集合方面的强烈愿景。在该愿景中,ddg可以通过将一大群垂直数据供应商结合到ddg的搜索框架中,从而获得更加广泛的搜索覆盖范围。举例来说,专为乐高定制的插件可以针对完整的乐高数据库进行搜索。再比如,如果在你要搜索的内容中有一种香料的名字,ddg就可将其识别出来并可能会触发针对高度优化的菜谱数据库进行更加深入的搜索。每次搜索可以触发多种不同的插件,而且这一切都是实时进行的。

难道所有这些数据不能通过搜索开放的web获得吗?真的不能。这些数据是具有语义的结构化数据。可不是html页面。你需要的搜索引擎是能够对更加丰富的数据集进行分类、映射、整合、过滤、定序、搜索、排版后还要消除歧义,只进行关键字搜索可办不到这些。你需要的是ddg所嵌入他们搜索引擎中的这种智慧。当然这里还有个问题,既然数据已经变得很珍贵了,许多已经成长起来的公司就再也不愿意将这些数据分享出来了。

ddg支持广告,这使ddg处于一种微妙的境地。定向广告(targeted ads)赚钱更多,但与此矛盾的是,ddg不做跟踪的策略意味着他们不能收集定向数据。 这个策略对那些关心隐私权的人来说还是一个卖点。但既然搜索是人尽皆知的目的驱动的,ddg将查询进行分类并将它们同数据源进行匹配的技术早已具有了高价值定向的形式。


三合一的魔力

你用搜索引擎查东西想要的当然是答案,而不是一堆的蓝色链接。duckduckgo 一开始就想到专注于为网上的信息查找打造出色的体验。它把脏累活(web 信息索引)留给了不同来源的第三方搜索引擎,而致力于为人们的查询提供即时答案。在即时答案的下方,duckduckgo 还聚合 bing、yandex 等第三方搜索的连接,并对其进行过滤和重组,减少了垃圾链接。

此外,duckduckgo 还靠第三方数据来源的糅合以及日益壮大的用户及开发者社区的深厚知识来帮助让答案更准确。

社区的力量:帮助开发产品,用户变成员工

社区对于 duckduckgo 的发展至关重要。duckduckg 的第一位全职员工 caine tighe 原来就是社区的一员,他对做一个新的搜索引擎的想法很感兴趣,主动联系 weinberg 问要不要帮忙,并帮助 duckduckgo 写了第一个 android 应用。

此后 duckduckgo 的 20 名左右的员工大都是通过这种方式招聘过来的。这是对公司贡献最积极的一批人,对公司核心产品的演进起到了至关重要的作用。

远程协作:尝试各种协作工具
duckduckgo 的总部位于宾夕法尼亚州的 paoli,fastcolabs 的这篇文章说,难以想象,对抗这个星球最大技术公司的叛军总部是如此的简朴和稀松平常。但其实这很正常,因为大多数员工都是远程办公。

他们尝试各种知道的协作工具,如 skype、yammer、hipchat、asana 等。网站的代码大部分是 perl 和 javascript 写的,托管在 git 和 github enterprise 上,而任何细小的变化都发布到 hipchat 聊天室内,以便让所有人都知道。但除此以外,对于员工的开发环境则没有任何限制。

duckduckgo 的这些做法令人印象深刻,除了duckduckgo搜索引擎以外,他们还做出了让用户定制搜索引擎的duckduckhack,并将面向公众的社区网站群整合成一个单一的 web 界面,充分体现出了众包的力量。如果说还有什么会阻止它取得巨大成功的话,我想应该就是拗口的名字了。