预览模式: 普通 | 列表
09-08
29

首页调用商品优惠价的方法(arclist调用附加字段)

{dede:arclist addfields='trueprice' row='2' channelid='6'}
[field:textlink /] - [field:softtype /] -[field:trueprice/]元<br />
{/dede:arclist}
这个标签就是用来调用商品优惠价在首页显示的代码了。

用arclist调用于附加表字段的方法:

要获取附加表内容,必须符合两个条件
1、指定 channelid 属性

查看更多...

分类:OpenSource | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 319
09-08
29

发一个Lucene 2.4.0对搜索结果高亮显示的代码

使用高亮显示时,需要单独引入lucene-highlighter-2.4.0.jar。这个jar包在目录 lucene-2.4.0\contrib\highlighter中,把它复制到项目的bin文件夹,并在Java Build Path中添加其引用。可以参考下面几个网页:

http://www.javaeye.com/wiki/topic/73588

http://hi.baidu.com/lotusxyhf/blog/item/cc06f634558516b4d0a2d329.html

导入的package有:

1import org.apache.lucene.search.highlight.Highlighter;

查看更多...

分类:Seo&Hacker | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 375
09-08
29

当前几个主要的Lucene中文分词器的比较

原文见:http://blog.fulin.org/2009/08/lucene_chinese_analyzer_compare.html,更多讨论请去原文处。

1. 基本介绍:

paoding :Lucene中文分词“庖丁解牛” Paoding Analysis
imdict :imdict智能词典所采用的智能中文分词程序
mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中文分词器
ik :采用了特有的“正向迭代最细粒度切分算法“,多子处理器分析模式

查看更多...

Tags: 中文 分词

分类:Seo&Hacker | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 500
09-08
29

mmseg4j 多分词模式与 paoding 分词效果对比

mmseg4j 1.6支持最多分词,应网友的要求:分词效果与 paoding 对比下。观察了 paoding 部分分词结果,现总结下。

paoding 分词效果:

引用内容 引用内容
--------------------------  
清华大学  
清华 | 大 | 华大 | 大学 |  
--------------------------  
华南理工大学  

查看更多...

Tags: mmseg4j paoding

分类:Seo&Hacker | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 655
09-08
26

tomcat支持shtml

tomcat版本5.X
1、将tomcat 的server\lib目录下servlets-ssi.renametojar文件重命名为servlets-ssi.jar。

      2、修改tomcat的 conf目录下web.xml文件,找到如下代码:

   /*
      <servlet>
        <servlet-name>ssi</servlet-name>
        <servlet-class>

查看更多...

Tags: TOMCAT shtml

分类:Java&Jsp | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 409
09-08
21

爬虫如何辨别文章的原创、伪原创与转载

在谈论之前,我们首先应该明确三个基本概念:原创与伪原创以及转载

先说转载:顾名思义就是原原本本的从网络媒体上照抄照搬过来的文章。

原创:很好理解,就是第一次在网络上发表的文章内容。

  伪原创:就是对网络上收集到的一些原创内容进行N次修改,转而进行发表的文章。比如修改文章的标题,增加文章摘要,转载不完整的文章内容等等。

  搜索引擎对于原创的识别判断是如何进行的呢?

查看更多...

Tags: 爬虫

分类:Seo&Hacker | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 332