预览模式: 普通 | 列表
08-07
18

流行分词组件比较

目前最新版本的lucene自身提供的StandardAnalyzer已经具备中文分词的功能,但是不一定能够满足大多数应用的需要。
另外网友谈的比较多的中文分词器还有:
CJKAnalyzer
ChineseAnalyzer
IK_CAnalyzer(MIK_CAnalyzer)
还有一些热心网友自己写的比较不错的分词器在此就不说了,有兴趣的可以自己研究研究。
以上三个中文分词器并不是lucene2.2.jar里提供的。
CJKAnalyzer和ChineseAnalyzer分别是lucene-2.2.0目录下contrib目录下analyzers的lucene-analyzers-2.2.0.jar提供的。分别位于cn和cjk目录。
IK_CAnalyzer(MIK_CAnalyzer)是基于分词词典,目前最新的1.4版本是基于lucene2.0开发的。以上分词器各有优劣,比较如下:

查看更多...

Tags: 流行 分词 组件 比较

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 562
08-07
18

Apache Lucene Java 2.3.0 发布

Apache Lucene Java 2.3.0 发布了。Apache Lucene可以说是Java社区全文检索引擎的事实标准,无人不晓,Lucene社区是相当活跃的,几乎每年都有两个版本发布,26号Lucene正式发布2.3版本。

新版本的特性:

l         索引性能的大幅度提高;

l         后台线程的合并;

l         可刷新的索引读写器;

查看更多...

Tags: Lucene java Apache

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 499
08-07
17

时光

    可能是被雨淋到而导致的发烧,烧得还不轻,当然也不是很重,活起来的问题不大。 只是很痛苦,身体发软,嘴发苦,眼睛干,总的来说比洗桑拿过瘾。 这样根本没法上班,只有去医院打点滴了,医院里的护士MM很好看,扎针扎得很疼。

查看更多...

Tags: 时光

分类:生活 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 564
08-07
16

dede 去掉采集内容中的超链接

5713090:
采集的时候,把文章内容里的链接去掉,过滤要怎么写

柏拉图:
{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim}

世界和平:
([^>]*)
什么意思,是不是代表任意字符!好想不是,

查看更多...

Tags: dede 采集 超链接

分类:Asp&Php | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 692
08-07
16

Hibernate中的query只一个数值count

String sql ="Select COUNT(*) FROM PRODUCTS as p Where p.g_id="+ cate.getId() +"";
Query query = session.createSQLQuery(sql, "p", Product.class);
Query query = session.createSQLQuery(sql);
Object[] ob=query.list().toArray();
int num = =Integer.parseInt(ob[0].toString());

查看更多...

Tags: count query

分类:Hibernate | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 570
08-07
16

SQLite简介

1、SQLite简介
SQLite第一个Alpha版本诞生于2000年5月. 至今已经有4个年头了. 而在今年的5月SQLite也迎来了一个新的里程: SQLite 3.
SQLite是一款轻型的数据库,它的设计目标是嵌入式的,而且目前已经在很多嵌入式产品中使用了它,它占用资源非常的低,在嵌入式设备中,可能只需要几百K的内存就够了。它能够支持Windows/Linux/Unix等等主流的操作系统,同时能够跟很多程序语言相结合,比如Tcl、PHP、Java等,还有ODBC接口,同样比起Mysql、PostgreSQL这两款开源世界著名的数据库管理系统来讲,它的处理速度比他们都快。

查看更多...

Tags: SQLite

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 397