作者:caocao(网络隐士),http://www.caocao.name,http://www.caocao.mobi
转载请注明来源:http://www.javaeye.com/topic/80073
书接前文(http://www.javaeye.com/topic/78884),上回说了个大致的原理,这回开始上代码。
五、原则
1、不改动lucene-core的代码
肆意改动lucene-core的代码实在是很不道德的事情,而且会导致后期维护升级的大量问题。如果真的有这等迫切需求,还不如加入lucene开发组,尽一份绵薄之力。看官说了,隐士你怎么不去啊,唉,代码比较丑陋,没脸去 ...
作者:caocao(网络隐士),http://www.caocao.name,http://www.caocao.mobi
转载请注明来源:http://www.javaeye.com/topic/78884
一、缘起
Lucene在索引文件上G之后的搜索性能下降很严重,随便跑个搜索就要上0.x秒。如果是单线程搜索那么性能尚可,总可以在0.x秒返回结果,如果是Web式的多线程访问,由于Lucene的内部机制导致数据被大量载入内存,用完后立即丢弃,随之引起JVM频繁GC,性能极其低下,1-10秒的长连接比比皆是。这也是世人为之诟病的Lucene应用瓶颈问题,那么是否有解决方法呢?
二、思 ...
作者:caocao(网络隐士),转载请注明来源:http://caocao.javaeye.com/blog/70305
随着Lucene 2.1.0在2007年情人节的问世,隐士遂将本来基于的2.0的应用升级到了2.1.0,升级日志如下:(2.1.0新功能请参见http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_1_0/CHANGES.txt)
1. LUCENE-478:新版在StandardAnalyzer将CJK分割为CJ, K,对于中文分词基本没用,隐士自创的中文分词基本没有修改直 ...
如欲转载,请注明作者:caocao,来源http://caocao.javaeye.com/。
Lucene的搜索结果默认按相关度排序,这个相关度排序是基于内部的Score和DocID,Score又基于关键词的内部评分和做索引时的boost。默认Score高的排前面,如果Score一样,再按索引顺序,先索引的排前面。那么有人问了,如果我要先索引的排后面怎么办呢?隐士研究了源码后发现这是相当简单的事情。以下代码基于Lucene 2.0。
看Sort的默认构造函数,相关度就是SortField.FIELD_SCORE和SortField.FIELD_DOC的组合。
java 代码
...
- 浏览: 117612 次
- 来自: 上海

- 详细资料
搜索本博客
最新评论
-
《神奇四侠2》抹黑上海, ...
好像看过了..
-- by femto -
《神奇四侠2》抹黑上海, ...
老外可以理解为不理解 自己人恶心自己人就让人忍不了了 看看国内的电影 叫 ...
-- by protti -
《神奇四侠2》抹黑上海, ...
因为04年的时候上海有反日游行 所以看起来上海很仇日 但是真的是这样吗? ...
-- by cddcdd -
硅谷之行 (28) 一进旧金山 ...
图文并茂,风趣盎然. Look forward to the next one. ...
-- by qlheng -
关于识别相似图像的算法探 ...
corvallis 写道说错了。用SIFT的feature直接计算distanc ...
-- by caocao






评论排行榜