-
证道lucene4
此专栏,是为了给学习lucene4.x的朋友们,提供一份不可多得的宝贵资料,散仙愿与大家一起分享交流全文检索技术。 qq技术交流群:324714439。
最近更新文章
转载请务必注明,原创地址,谢谢配合!
http://qindongliang1922.iteye.com/blog/1999154
上篇文章,散仙介绍了indexwriter的作用,它的最大价值体现在对索引的创建,管理和维护上,通过与indexwriterconfig这个配置管理类的组合,可以实现最佳的索引策略,当然前提是你得了解indexwriterconfig里一些重要的参数的配置含义。
...
转载请务必注明,原创地址,谢谢配合!
http://qindongliang1922.iteye.com/blog/1998532
散仙,在上篇文章,分析了indexwriterconfig的作用以及一些功能,今天在这开 ...
转载请务必注明,原创地址,谢谢配合!
http://qindongliang1922.iteye.com/blog/1997577
散仙,在上篇文章中分析了indexreader家族的两个重要模块分别是它的两个重要的子类,一种是基于原子的reader可以直接获取索引存储的具体信息,另外一种复合reader,用于宏观层面上接入索引的重要辅助类,两者相辅相成,缺一不可。
那么本篇,散仙简要分析下 ...
转载请务必注明,原创地址,谢谢配合!
http://qindongliang1922.iteye.com/blog/1995329
散仙在前2篇文章中,简单分析了directory家族的功能以及作用,同时也对directory家族中我们比较常用的几个子类,做了剖析和归纳,那么本篇文章,散仙就来介绍下与directory家族经常进行交互的另一大家族indexreader家族,另外需要说明的是,散 ...
转载请务必注明,原创地址,谢谢配合!
http://qindongliang1922.iteye.com/blog/1990616
时间过的真快,又有半个月没更新lucene的文章了,散仙最近在工作上,稍微忙了一点,还学了一些其他的知识,不过这都不是借口,还是有点小懒啊,呵呵,今天晚上,就再写一篇吧,说实话,几天不写博客,心里挺憋的慌的,不知道你们是否有这种情况?学点技术,最好能整理一下到博客 ...
转载请务必注明,原创地址,谢谢配合!
http://qindongliang1922.iteye.com/blog/1980262
lucene在最近的几个月里已经频繁更新了好几个版本了,越是更新的频繁,就越证明一件事,这个东西越来越流行,越来越火,就在散仙写此篇文章时候,lucene官方已经更新到4.6的版本了,在此,散仙,不得不力赞一下开源界的力量。
好了,言归正传,散仙今天就从源码的角度 ...
转载请注明,原创地址,谢谢配合!
http://qindongliang1922.iteye.com/blog/1972785
不知不觉,已经又过去一个多月了,lucene已经更新到4.5.1的版本了,散仙这段时间在研究hadoop方面的知识,lucene系列的文章已经一个月没更新了,不过,散仙的核心还在lucene上,后面会尽量抽出时间,持续更新lucene系列博文。
散仙今天要分享的是关 ...
转载请注明,原创地址,谢谢配合!
http://qindongliang1922.iteye.com/blog/1953409
高亮功能一直都是全文检索的一项非常优秀的模块,在一个标准的搜索引擎中,高亮的返回命中结果,几乎是必不可少的一项需求,因为通过高亮,我们可以在我们的搜索界面上快速标记出用户的检索关键词,从而减少了用户自己寻找想要的结果,在一定程度上大大提高了用户的体验性和友好度。 ...
转载请注明原创地址:
http://qindongliang1922.iteye.com/blog/1942030
今天散仙要写的是关于lucene里面collector这个东西,暂且称它为收集器吧,先来看下lucene内置collector类的继承图。
我们先来回顾下,一个基本的搜索流程是怎么完成的
1,得到一个索引目录directory(可能基于内存的或者磁盘的)。
2,得到一 ...
转载请注明,原创地址,谢谢配合!
http://qindongliang1922.iteye.com/blog/1938234
上次散仙给大家总结了lucene中,一些常用filter的用法和例子,今天,我们在来看下不在filter家族中的一个特殊的filter,属于lucene捐赠模块的特殊包中的类duplicatefilter,这个filter的作用是用来对某个字段进行去重操作的,类似 ...
转载请注明,原创地址,谢谢配合!
http://qindongliang1922.iteye.com/blog/1934607
散仙前些日子写了两篇lucene的插曲,分别是关于分词和分页的知识,虽然当成插曲写,但是其内容还是比较重要的,因为那些知识在实际的运用以及开发中用的还是比较常见,所以还是要用心的了解一下。
散仙今天要写的是关于过滤方面的知识,也就是filter,如果了解solr的 ...
允许转载,转载请注明原创地址:
http://qindongliang1922.iteye.com/blog/1931191
谢谢配合
散仙在上篇文章中,总结了几个lucene的特殊的分词需求,以及怎么定制我们自己的tokenizer和analyzer用来处理他们,那么本篇我们依旧是分析用户需求(哈哈,也不算是用户需求,群里面(324714439)朋友们提问的问题),然后找到最合适的解决方 ...
允许转载,转载请注明原创地址:
http://qindongliang1922.iteye.com/blog/1927605
谢谢配合
最近在群里面(324714439)遇到几位朋友提出了一些特殊的分词需求,在此做个总结。本来的lucene的内置的分词器,差不多可以完成我们的大部分分词工作了,如果是英文文章那么可以使用standardanalyzer标准分词器,whitespaceanalyz ...
本文章允许转载,转载请注明原创地址
http://qindongliang1922.iteye.com/blog/1924608
排序是对于全文检索来言是一个必不可少的功能,在实际运用中,排序功能能在某些时候给我们带来很大的方便,比如在淘宝,京东等一些电商网站我们可能通过排序来快速找到价格最便宜的商品,或者通过排序来找到评论数最高或卖的最好的商品,再比如在iteye里的博客栏里,每天都会以 ...
为防止,一些小网站私自盗用原文,请支持原创
原文永久链接:http://qindongliang1922.iteye.com/blog/1922742
前面几章笔者把lucene基本入门的任督二脉给打通了,从此篇开始,就开始进行lucene的进阶开发了,那么首先摆在我们面前的第一个必须要解决的问题,就是关于中文分词的问题,因为lucene毕竟是国外的大牛们开发的,显然会比较侧重英文文章 ...
前面几篇笔者已经把lucene的最基本的入门,介绍完了,本篇就对lucene基本的知识做一个总结,以便于加深对lucene基本api组件的理解。
为了方便对比学习,下面给出表格数据
索引期间使用的api组件检索期间使用的api组件indexwriterindexreaderindexwriterconfigindexsearcherdirectorydirectoryanalyzerqueryp ...
上次笔者简单介绍下了,lucene的入门搭建以及一个添加的demo,这次写了一个包含增删改查比较完整的例子,以供各位入门新手的道友们参考,当然这个只是最简单的封装,有很多参数都是写死的 ,所以有点不灵活,各位朋友也可以自己试着参考笔者的demo封装一个比较通用的例子,在实际的项目环境中,封装一定要做到既通用又灵活,这个看各位的业务的需求了,不同的业务需求可能不一样。
在入门,搭建好最基本的环境之 ...
m6手机网页版登录首页,本篇适合对于刚学lucene的朋友们,在这之前笔者还是喜欢啰嗦几句,想要学好一门技术,首先就得从思想层次上全面了解这种技术的作用,适用范 ...
lucene是一款很优秀的全文检索的开源库,目前最新的版本是lucene4.4,关于lucene的历史背景以及发展状况,在这里笔者就不多介绍了,如果你真心想学习lucen ...
lucene在4.x之前,没有实现分组的功能,如果业务中有需要分组的功能,那么必须的借助第三方的提供的插件,来实现分组,例如bobo-browse,或者,自己用lucene写分组功能,笔者个人觉得用第三方的分组插件,虽说功能强大,但是比较繁琐,自己写的话,可以实现,但是效率方面却不是很好,在4.x之后,lucene已经自己实现分组功能提供了分组jar包
lucene-grouping-4.2. ...
- 专栏创建者:qindongliang1922
- 创建时间:2013-11-27 13:25:26
- 专栏文章数:20篇
- 专栏被浏览:115591 次
本专栏热门文章
最新评论
遇到的问题同楼上 为什么会返回null
章司nana 评论了
章司nana 评论了
内容非常不错,就是字体能修改一下就好了
静妙仙人 评论了
静妙仙人 评论了
楼主是个勤快的人,半夜还写呢,我也在坚持,最近在弄lucene,发现lucene5还是改进挺多的,从第 ...
fengshizty 评论了
fengshizty 评论了
很好 谢谢lz
a0001aa 评论了
a0001aa 评论了
ansjsun 写道fengbin2005 写道qindongliang1922 写道ansjsun ...
flashing 评论了
flashing 评论了
潦倒几句 写道directory indexwrite每次都要重新创建,还是只需创建一次最好是单例的
qindongliang1922 评论了
qindongliang1922 评论了
directory indexwrite每次都要重新创建,还是只需创建一次
潦倒几句 评论了
潦倒几句 评论了
你好,为什么我在使用你的fastvectorhighlighter代码进行高亮的时候,如果使用高亮显示 ...
seven_zhao 评论了
seven_zhao 评论了
楼主,敢分享下ik的jar包吗,我找了很久没有和你demo一样的ik jar包!可以的话,yibuyi ...
yibuyimeng 评论了
yibuyimeng 评论了
queryparser parser 你所给的jar包中,没有这个类
yibuyimeng 评论了
yibuyimeng 评论了