lucene-wiki翻译:如何提高索引速度-3
- 原文:http://wiki.apache.org/lucene-java/ImproveIndexingSpeed
- 导航:Lucene-java Wiki-》1 Overview-》1.1 Informational-》 1.1.1BasicsOfPerformance-》1.1.1.4 ImproveIndexingSpeed
- 注意:“ 红色 ”,表示不知道、不确定怎么翻译。 “ 蓝色”自己的描述。
- 状态:完成
8.以同样的顺序在Document中添加fields
原文 写道
Always add fields in the same order to your Document, when using stored fields or term vectors
Lucene's merging has an optimization whereby stored fields and term vectors can be bulk-byte-copied, but the optimization only applies if the field name -> number mapping is the same across segments. Future Lucene versions may attempt to assign the same mapping automatically (see LUCENE-1737), but until then the only way to get the same mapping is to always add the same fields in the same order to each document you index.
以同样的顺序在Document中添加fields,大家平时就是这么做的。Lucene在合并索引的时候有一个优化功能,即可以根据field和term vectors实现批量字节拷贝,但该优化只有在 name->number映射在所有segments都相同的情况下方可实现。未来的lucene版本可能将会实现自动映射(参看),但目前为止,只有“以同样的顺序在Document中添加fields”这一种方式来获得一样的映射。
9.在分析器Analyzers 中复用(单例模式)Token 实例
在分析器Analyzers 中复用(单例模式)Token 实例。对于需要建立索引的Field,分析器Analyzers会为其中的没个term创建一个Token 对象。你可以通过复用Token来降低垃圾回收的消耗。
人家的翻译:
悲哀啊,我到现在没用过token,啥情况???
10.用Tokenz中的char[] API代替String API来表示数据
原文 写道
represent ...as : 把…描绘成 。晕,这都忘记了。
人家的翻译
上一篇: __EMIT伪指令