09-12
16

用Java读取word中的数据

用Java简单的读取word文档中的数据:
第一步:下载tm-extractors-0.4.jar
下载地址:http://drc-dev.ohiolink.edu/browser/elated-core/trunk/lib/tm-extractors-0.4.jar?rev=46 并把它放到你的classpath路径下面。
第二步:简单的程序.(WordReader .java)
前提是你的E盘下有个Strust.doc文件。
import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader {

public static String readDoc(String doc) throws Exception {
  // 创建输入流读取doc文件
  FileInputStream in = new FileInputStream(new File(doc));
  WordExtractor extractor = null;
  String text = null;
  // 创建WordExtractor
  extractor = new WordExtractor();
  // 对doc文件进行提取
  text = extractor.extractText(in);
  return text;
}
/**
  * @param args
  */
public static void main(String[] args) {
  // TODO Auto-generated method stub
        try{
         String text = WordReader.readDoc("E:/Strust.doc");
         System.out.println(text);
        }catch(Exception ex){
         ex.printStackTrace();
        }
}
}
  
   这样就简单的完成了从word中读取数据了。你可以把它生成一个txt的文件。

文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags: word 读取
相关日志:
评论: 0 | 引用: 0 | 查看次数: 290
发表评论
昵 称:
密 码: 游客发言不需要密码.
内 容:
验证码: 验证码
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.
字数限制 1000 字 | UBB代码 开启 | [img]标签 关闭