多Tag检索有没有什么好的优化方案

程序员文章站 2022-04-30 19:36:01

...

比如淘宝。一件商品有很多tag（指的是淘宝商品列表搜索的tag，非商品本身尺寸等类型tag）。

搜索完毕，出现

产地：北京，xx，xx，xx，xx
颜色：xx，xx，xx，xx，xx，xx
等等：xx，xx，xx，xx，xx

现在的表结构：

tag:
t_id(标签id),t_name(标签名称)

tag_relation: t_id(标签id),product_id(商品id) 有木有好的查询优化方案？

想过用redis作数据索引，最后用分页后的id取MySQL数据。但是又有一个索引重建的问题。数据量少还好说。但是数据量一上去就要疯了。

想了解一下有没有什么好的方案来实现。比如考虑过sphinx，但没有想到方案。

还有一个需求就是，要所有tag下当前搜索条件所有数据的综合。

比如：选中tagname为“北京”，的数据，那么其他的tagname的数据量应该为0，且北京下属的颜色数据，比如北京下，蓝色数据为1，黑色数据为3，等等。。求方案。

回复内容：

比如淘宝。一件商品有很多tag（指的是淘宝商品列表搜索的tag，非商品本身尺寸等类型tag）。

搜索完毕，出现

产地：北京，xx，xx，xx，xx
颜色：xx，xx，xx，xx，xx，xx
等等：xx，xx，xx，xx，xx

现在的表结构：

tag:
t_id(标签id),t_name(标签名称)

tag_relation: t_id(标签id),product_id(商品id) 有木有好的查询优化方案？

想过用redis作数据索引，最后用分页后的id取MySQL数据。但是又有一个索引重建的问题。数据量少还好说。但是数据量一上去就要疯了。

想了解一下有没有什么好的方案来实现。比如考虑过sphinx，但没有想到方案。

还有一个需求就是，要所有tag下当前搜索条件所有数据的综合。

数据量大的话，可以考虑下solr，
solr 支持facet 搜索的特性，传送门:http://wenku.baidu.com/view/1c3fd63143323968011c92cc
这个特性可以让我们根据‘分类’、‘标签’、以及关键字一起搜索目标

sphinx 定时重建索引。

如果实时性要求较高，把最近更新的商品数据放到增量索引里面，重建索引频繁点就行。

以上满足几十万商品的级别没问题。

淘宝这样的海量的商品，必然是分布式索引了