import   java.net.*;
  import   java.io.*;
  import   java.util.*;
  public   class   URLDemo   {

  public   static   void   main(String[]   args)   {

Tags: 远程远程采集采集 uncode uncode

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 238

08-10

18

dede采集过滤全收罗

作者:Java伴侣日期:2008-10-18

dede采集过程中最麻烦的莫过于采集的正则过滤函数的编写。说实在的，dede在这点上和很多ASP CMS系统比如说动易等，采集的时候直接选择几个选项就可以了，简单的完成想过滤的东西。不过他们只局限于对文章内容的过滤不是很好。而DEDE却能对所有采集的字段进行过滤，功能上弥补了易用性的缺陷，期待柏拉图在后续版本中加上选择性过滤功能。
下面是在综合论坛上网友的各种正则的一个全集：

以下是常用过滤：
{dede:trim} {/dede:trim} // 过滤空格
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}
{dede:trim}<div([^>]*)>([^<]*)</div>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}

Tags: dede dede 采集采集

分类:Asp&Php | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 509

08-09

05

dede采集，增加文章来源

作者:Java伴侣日期:2008-09-05

第一步修改【数据规则模型管理】中的文章模型

第二步在【字段设定】中增加一个字段

Tags: dede dede 采集采集

分类:Asp&Php | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 741

08-09

01

采集规则：部分内容截取，然后得到集合(正则和逻辑两种)

作者:Java伴侣日期:2008-09-01

引用内容

比如，我有一个变量:
String text="aabbsdasdaiqo<a href="xxx"/>sasdadsa<a href="eee"/>sdasadpqwo<a href="ggg"/>||wxwdqwq<a href="bbb"/>...";

问题，如何取得text之中href=".."中的全部值，就是xxx,eee,ggg,bbb,把他们全部放入一个list中

正则的：

复制内容到剪贴板

程序代码

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;

Tags: 采集采集截取截取集合集合

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 742

火车采集时，典型测试与在线发布不同步的解决办法

作者:Java伴侣日期:2009-10-26

获得的超链接和超链接文字-采集演绎java的正则表达式

作者:Java伴侣日期:2009-06-12

远程采集，无乱码

作者:Java伴侣日期:2009-06-11

dede采集过滤全收罗

作者:Java伴侣日期:2008-10-18

dede采集，增加文章来源

作者:Java伴侣日期:2008-09-05

采集规则：部分内容截取，然后得到集合(正则和逻辑两种)

作者:Java伴侣日期:2008-09-01

Search

SweetTitles

Category

User Panel

Recent Comments

Statistics

Archive

Links

火车采集时，典型测试与在线发布不同步的解决办法

作者:Java伴侣 日期:2009-10-26

获得的超链接和超链接文字-采集演绎java的正则表达式

作者:Java伴侣 日期:2009-06-12

远程采集，无乱码

作者:Java伴侣 日期:2009-06-11

dede采集过滤全收罗

作者:Java伴侣 日期:2008-10-18

dede采集，增加文章来源

作者:Java伴侣 日期:2008-09-05

采集规则：部分内容截取，然后得到集合(正则和逻辑两种)

作者:Java伴侣 日期:2008-09-01

Search

SweetTitles

Category

User Panel

Recent Comments

Statistics

Archive

Links

作者:Java伴侣日期:2009-10-26

作者:Java伴侣日期:2009-06-12

作者:Java伴侣日期:2009-06-11

作者:Java伴侣日期:2008-10-18

作者:Java伴侣日期:2008-09-05

作者:Java伴侣日期:2008-09-01