欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

多Tag检索有没有什么好的优化方案

程序员文章站 2022-04-30 19:36:01
...
比如淘宝。一件商品有很多tag(指的是淘宝商品列表搜索的tag,非商品本身尺寸等类型tag)。

搜索完毕,出现

产地:北京,xx,xx,xx,xx
颜色:xx,xx,xx,xx,xx,xx
等等:xx,xx,xx,xx,xx

现在的表结构:

tag:
t_id(标签id),t_name(标签名称)

tag_relation: t_id(标签id),product_id(商品id) 有木有好的查询优化方案?

想过用redis作数据索引,最后用分页后的id取MySQL数据。但是又有一个索引重建的问题。数据量少还好说。但是数据量一上去就要疯了。

想了解一下有没有什么好的方案来实现。比如考虑过sphinx,但没有想到方案。

还有一个需求就是,要所有tag下当前搜索条件所有数据的综合。

比如:选中tagname为“北京”,的数据,那么其他的tagname的数据量应该为0,且北京下属的颜色数据,比如北京下,蓝色数据为1,黑色数据为3,等等。。求方案。

回复内容:

比如淘宝。一件商品有很多tag(指的是淘宝商品列表搜索的tag,非商品本身尺寸等类型tag)。

搜索完毕,出现

产地:北京,xx,xx,xx,xx
颜色:xx,xx,xx,xx,xx,xx
等等:xx,xx,xx,xx,xx

现在的表结构:

tag:
t_id(标签id),t_name(标签名称)

tag_relation: t_id(标签id),product_id(商品id) 有木有好的查询优化方案?

想过用redis作数据索引,最后用分页后的id取MySQL数据。但是又有一个索引重建的问题。数据量少还好说。但是数据量一上去就要疯了。

想了解一下有没有什么好的方案来实现。比如考虑过sphinx,但没有想到方案。

还有一个需求就是,要所有tag下当前搜索条件所有数据的综合。

比如:选中tagname为“北京”,的数据,那么其他的tagname的数据量应该为0,且北京下属的颜色数据,比如北京下,蓝色数据为1,黑色数据为3,等等。。求方案。

数据量大的话,可以考虑下solr,
solr 支持facet 搜索的特性,传送门:http://wenku.baidu.com/view/1c3fd63143323968011c92cc
这个特性可以让我们根据‘分类’、‘标签’、以及关键字一起搜索目标

sphinx 定时重建索引。

如果实时性要求较高,把最近更新的商品数据放到增量索引里面,重建索引频繁点就行。

以上满足几十万商品的级别没问题。

淘宝这样的海量的商品,必然是分布式索引了