欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

mongodb处理中文索引与查找字符串详解

程序员文章站 2022-03-24 07:51:03
参考文献 首先自打3.2版本之后,就开始支持中文索引了,支持的所有的语言参考这里: 然后,对于要支持索引的表需要建议text index,如何建立参考这里:...

参考文献

首先自打3.2版本之后,就开始支持中文索引了,支持的所有的语言参考这里:

然后,对于要支持索引的表需要建议text index,如何建立参考这里:

在建好索引text之后,如果检索参考:

实例

我有一个表,定义如下:

var articleschema = new schema({
 created: {
 type: date,
 default: date.now
 },
 title: {
 type: string,
 default: '',
 trim: true,
 required: 'title cannot be blank'
 },
 abstract: {
 type: string,
 default: '',
 trim: true
 },
 abstractimg: {
 type: string,
 default: 'http://www.doocr.com/modules/core/client/img/brand/font-ocr.png',
 trim: true
 },
 content: {
 type: string,
 default: '',
 trim: true
 },
 category: {
 type: string,
 default: 'news',
 trim: true
 },
 user: {
 type: schema.objectid,
 ref: 'user'
 },
 topublish: {
 type: boolean,
 default: true
 },
 comments: [commentschema]
 });

然后,里面有数据的,所以我直接检索,得到结果:

> db.articles.find( { $text: { $search: "coffee" } } )
error: error: {
 "waitedms" : numberlong(0),
 "ok" : 0,
 "errmsg" : "text index required for $text query",
 "code" : 27
}

说明没有建议text索引,那么建一个:

db.articles.createindex( {title: "text", content: "text" })

看看效果:

> db.articles.createindex(
... {
... title: "text",
... content: "text"
... }
... )

下面是结果,成功了

{
 "createdcollectionautomatically" : false,
 "numindexesbefore" : 1,
 "numindexesafter" : 2,
 "ok" : 1
}

然后我开始检索:

> db.articles.find( { $text: { $search: "coffee" } } )

什么都没有。

我检索一个存在的中文:

> db.articles.find( { $text: { $search: "操作" } } )
{ "_id" : objectid("58b0eb5a136dc51b541eaf81"), "user" : objectid("589c8d22f7d9dc15989be255"), "comments" : [ ], "topublish" : true, "category" : "blog", "content" : "<p> </p><p><br/></p><p>其实就是使用ubuntu 16的安装方式,参考网址:</p><p><a href=\"https://docs.mongodb.com/master/tutorial/install-mongodb-on-ubuntu/\" target=\"_blank\">https://docs.mongodb.com/master/tutorial/install-mongodb-on-ubuntu/</a></p><p><br/></p><p>我的操作步骤:</p><pre>1.倒入key:sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv ea312927
</pre><p><br/></p><p>2. 创建mongodb的软件源:</p><p>/etc/apt/sources.list.d/mongodb-org-3.2.list</p><p>操作:</p><pre>echo "deb http://repo.mongodb.org/apt/ubuntu xenial/mongodb-org/3.2 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-3.2.list
</pre><p><br/></p><p>3. 更新系统:</p><p>sudo apt update</p><p>之后查看所有可以更新的软件:</p><p>sudo apt list --upgradable</p><p>然后升级所有软件:</p><p>sudo apt upgrade</p><p><br/></p><p>4. 安装mongodb :</p><p>sudo apt install -y mongodb-org</p><p>也可以指定版本安装:</p><p>sudo apt-get install -y mongodb-org=3.2.8 mongodb-org-server=3.2.8 mongodb-org-shell=3.2.8 mongodb-org-mongos=3.2.8 mongodb-org-tools=3.2.8</p><p>不过我不使用这种方式。</p><p><br/></p><p>5. 添加systemd 自启动条目:</p><p>sudo vim /lib/systemd/system/mongod.service</p><p>添加内容:</p><p>[unit]</p><p>description=high-performance, schema-free document-oriented database</p><p>after=network.target</p><p>documentation=https://docs.mongodb.org/manual</p><p><br/></p><p>[service]</p><p>user=mongodb</p><p>group=mongodb</p><p>execstart=/usr/bin/mongod --quiet --config /etc/mongod.conf</p><p><br/></p><p>[install]</p><p>wantedby=multi-user.target</p><p><br/></p><h2>6. 使能和启动服务:</h2><p>sudo systemctl enable mongod.service</p><p>sudo systemctl start mongod.service</p><p><br/></p><h2>查看状态,一切ok。</h2><p>sudo systemctl status mongod.service</p><p>● mongod.service - high-performance, schema-free document-oriented database</p><p>loaded: loaded (/lib/systemd/system/mongod.service; enabled; vendor preset: enabled)</p><p>active: active (running) since sun 2016-07-31 21:59:00 cst; 13min ago</p><p>docs: https://docs.mongodb.org/manual</p><p>main pid: 19374 (mongod)</p><p>cgroup: /system.slice/mongod.service</p><p>└─19374 /usr/bin/mongod --quiet --config /etc/mongod.conf</p><p><br/></p><p>jul 31 21:59:00 mint systemd[1]: started high-performance, schema-free document-oriented database.</p><p><br/></p><p>7. 查看服务启动端口是否ok:</p><p>azuo1228@mint ~/webproj/mjs2/meanjs $ netstat -apn | grep mong</p><p>(not all processes could be identified, non-owned process info</p><p>will not be shown, you would have to be root to see it all.)</p><p>unix 2 [ acc ] stream listening 76731 - /tmp/mongodb-27017.sock</p><p><br/></p><p><br/></p>", "abstractimg" : "http://www.doocr.com/modules/core/client/img/brand/font-ocr.png", "abstract" : "其实就是使用ubuntu 16的安装方式,参考网址:", "title" : "其实就是使用ubuntu 16的安装方式,参考网址:", "created" : isodate("2017-02-25t02:26:34.483z"), "__v" : 0 }
>

最后

但是这种检索都是不完美的,如果需要更好的支持,就需要参考:

安装rlp支持mongodb检索中文,但是不是免费的。。。

所以,最好的方式就是使用elastic search同步mongodb,然后通过它检索,超出本文范围了,以后再说。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对的支持。