用Java简单的读取word文档中的数据:
第一步:下载tm-extractors-0.4.jar
下载地址:http://drc-dev.ohiolink.edu/browser/elated-core/trunk/lib/tm-extractors-0.4.jar?rev=46 并把它放到你的classpath路径下面。
第二步:简单的程序.(WordReader .java)
前提是你的E盘下有个Strust.doc文件。
import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader {
第一步:下载tm-extractors-0.4.jar
下载地址:http://drc-dev.ohiolink.edu/browser/elated-core/trunk/lib/tm-extractors-0.4.jar?rev=46 并把它放到你的classpath路径下面。
第二步:简单的程序.(WordReader .java)
前提是你的E盘下有个Strust.doc文件。
import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader {
推荐jacob 就是 JAVA-COM Bridge的缩写,它是在java与微软的com组件之间的桥梁,通过使用jacob自带的dll动态链接库通过JNI的方式实现了在sun java平台上的程序对com调用。jacob的作者照搬了微软java开发包中调用com组件的模式,并将它在sun java平台上实现,可谓是用心良苦啊。
这是一个开始于1999年的开源项目的成果,
首先,我们要向jacob的开发者-Dan Adler致敬,感谢他的开源精神和其团队的伟大贡献!
之后,有很多使用者对该项目进行了修改,做出了自己的贡献,我们同样要致以敬意!
1。下在Java-COM连接桥JACOB(http://danadler.com/jacob/),需要jacob.jar和jacob.dll两个文件就可以了(可以到http://sourceforge.net/project/showfiles.php?group_id=109543&package_id=118368下载)。并把jacob.dll放到system32文件夹里面,把jacob.jar放到CLASSPATH里:
注意,不要使用它里面提供的jacob.dll。
这是一个开始于1999年的开源项目的成果,
首先,我们要向jacob的开发者-Dan Adler致敬,感谢他的开源精神和其团队的伟大贡献!
之后,有很多使用者对该项目进行了修改,做出了自己的贡献,我们同样要致以敬意!
1。下在Java-COM连接桥JACOB(http://danadler.com/jacob/),需要jacob.jar和jacob.dll两个文件就可以了(可以到http://sourceforge.net/project/showfiles.php?group_id=109543&package_id=118368下载)。并把jacob.dll放到system32文件夹里面,把jacob.jar放到CLASSPATH里:
注意,不要使用它里面提供的jacob.dll。
通过Jacob可以很方便的通过编程操作Word等MS组件,以前我也写过一篇关于如何使用Jacob进行将word文档转为html和其他格式的文档(
http://blog.csdn.net/guoxiaoshou2000/archive/2004/12/07/208024.aspx
);而且附上了源码。
但是最近有些朋友跟我联系,说无法正确执行我提供的代码,提示的错误如下:
com.jacob.com.ComFailException: Invoke Failed: Documents at com.jacob.com.Dispatch.invokev(Native Method) at
http://blog.csdn.net/guoxiaoshou2000/archive/2004/12/07/208024.aspx
);而且附上了源码。
但是最近有些朋友跟我联系,说无法正确执行我提供的代码,提示的错误如下:
com.jacob.com.ComFailException: Invoke Failed: Documents at com.jacob.com.Dispatch.invokev(Native Method) at
用tomcat6.0,本来好好的,不知怎么突然出现错误,好像不是代码的问题
2008-1-8 9:36:30 org.apache.catalina.session.StandardManager doLoad
严重: IOException while loading persisted sessions: java.io.EOFException
java.io.EOFException
at java.io.ObjectInputStream$PeekInputStream.readFully(Unknown Source)
at java.io.ObjectInputStream$BlockDataInputStream.readShort(Unknown Sour
ce)
at java.io.ObjectInputStream.readStreamHeader(Unknown Source)
at java.io.ObjectInputStream. <init>(Unknown Source)
2008-1-8 9:36:30 org.apache.catalina.session.StandardManager doLoad
严重: IOException while loading persisted sessions: java.io.EOFException
java.io.EOFException
at java.io.ObjectInputStream$PeekInputStream.readFully(Unknown Source)
at java.io.ObjectInputStream$BlockDataInputStream.readShort(Unknown Sour
ce)
at java.io.ObjectInputStream.readStreamHeader(Unknown Source)
at java.io.ObjectInputStream. <init>(Unknown Source)
复制内容到剪贴板 程序代码
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.nio.channels.FileChannel;
import java.util.ArrayList;
import java.util.Iterator;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.nio.channels.FileChannel;
import java.util.ArrayList;
import java.util.Iterator;