09-12
15

使用Java将Word转为Html或txt!

package com.blcms.util.plus.word;

//-------------------------------------------------------
//版权所有 (C) 浪潮集团商用系统有限公司  保留所有权利
//文件名称: wordtohtml           文件版本: 1.00.00
//作    者: 郭铸     作者邮箱: guozhu@langchao.com  完成日期: 2004-10-20
//文件描述:
//其它描述:
//类 列 表:
//  wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
//修改历史:
//  #   版本     修改日期    作者                 修改内容
//  -------------------------------------------
//  1   1.00.01  2004-10-14  作者姓名             修改内容描述
//  ----------------------------------------------------------
//-------------------------------------------------------
import com.jacob.com.*;
import com.jacob.activeX.*;
import java.io.*;

//取得指定目录下面所有的doc文件名称
public class WordtoHtml {
    // -------------------------------------------------
    // 方法原型: change(String paths)
    // 功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
    // 输入参数: String
    // 输出参数: 无
    // 返 回 值: 无
    // 其它说明: 递归
    // --------------------------------------------
    public static void change(String paths, String savepaths) {

        File d = new File(paths);
        // 取得当前文件夹下所有文件和目录的列表
        File lists[] = d.listFiles();
        String pathss = new String("");

        // 对当前目录下面所有文件进行检索
        for (int i = 0; i < lists.length; i++) {
            if (lists[i].isFile()) {
                String filename = lists[i].getName();
                String filetype = new String("");
                // 取得文件类型
                filetype = filename.substring((filename.length() - 3), filename
                        .length());

                // 判断是否为doc文件
                if (filetype.equals("doc")) {
                    System.out.println("当前正在转换......");
                    // 打印当前目录路径
                    System.out.println(paths);
                    // 打印doc文件名
                    System.out.println(filename.substring(0,
                            (filename.length() - 4)));

                    ActiveXComponent app = new ActiveXComponent(
                            "Word.Application");// 启动word

                    String docpath = paths + filename;
                    String htmlpath = savepaths
                            + filename.substring(0, (filename.length() - 4));

                    String inFile = docpath;
                    // 要转换的word文件
                    String tpFile = htmlpath;
                    // HTML文件

                    boolean flag = false;

                    try {
                        app.setProperty("Visible", new Variant(false));
                        // 设置word不可见

                        Object docs = app.getProperty("Documents").toDispatch();
                        Object doc = Dispatch.invoke(
                                docs,
                                "Open",
                                Dispatch.Method,
                                new Object[] { inFile, new Variant(false),
                                        new Variant(true) }, new int[1])
                                .toDispatch();
                        // 打开word文件
                        Dispatch.invoke(doc, "SaveAs", Dispatch.Method,
                                new Object[] { tpFile, new Variant(8) },
                                new int[1]);
                        // 作为html格式保存到临时文件
                        Variant f = new Variant(false);
                        Dispatch.call(doc, "Close", f);
                        flag = true;
                    } catch (Exception e) {
                        e.printStackTrace();
                    } finally {
                        app.invoke("Quit", new Variant[] {});
                    }
                    System.out.println("转化完毕!");
                }
            } else {
                pathss = paths;
                // 进入下一级目录
                pathss = pathss + lists[i].getName() + "\\";
                // 递归遍历所有目录
                change(pathss, savepaths);
            }
        }

    }

    // ---------------------------------------------------------
    // 方法原型: main(String[] args)
    // 功能描述: main文件
    // 输入参数: 无
    // 输出参数: 无
    // 返 回 值: 无
    // 其它说明: 无
    // ----------------------------------------------------------
    public static void main(String[] args) {

        String paths = new String(
                "D:\\work\\word\\");
        String savepaths = new String(
                "D:\\work\\html\\");
        change(paths, savepaths);

    }
}


使用Java将Word转为Html或txt!

http://www.webjx.com/program/2004121115.htm


--------------------------------------------------------------------------------

http://www.csdn.net 2004年12月11日 CSDN

  使用Java将Word转为Html或txt。前一段时间为这个问题头疼的不得了,后来查阅了资料终于解决了;现将程序放出,以便以后参考。


  //-------------------------------------------------------
  //版权所有 (C) 浪潮集团商用系统有限公司  保留所有权利
  //文件名称: wordtohtml           文件版本: 1.00.00
  //作    者: 郭铸     作者邮箱: guozhu@langchao.com  完成日期: 2004-10-20
  //文件描述:
  //其它描述:
  //类 列 表:
  //  wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
  //修改历史:
  //  #   版本     修改日期    作者                 修改内容
  //  -------------------------------------------
  //  1   1.00.01  2004-10-14  作者姓名             修改内容描述
  //  ----------------------------------------------------------
  //-------------------------------------------------------
  import com.jacob.com.*;
  import com.jacob.activeX.*;
  import java.io.*;
  //取得指定目录下面所有的doc文件名称
  public class wordtohtml
  {
  //-------------------------------------------------
  //方法原型: change(String paths)
  //功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
  //输入参数: String
  //输出参数: 无
  //返 回 值: 无
  //其它说明: 递归
  //--------------------------------------------
  public static void change(String paths, String savepaths)
  {
  
  File d = new File(paths);
  //取得当前文件夹下所有文件和目录的列表
  File lists[] = d.listFiles();
  String pathss = new String("");

  //对当前目录下面所有文件进行检索
  for(int i = 0; i < lists.length; i ++)
  {
  if(lists[i].isFile())
  {
  String filename = lists[i].getName();
  String filetype = new String("");
  //取得文件类型
  filetype = filename.substring((filename.length() - 3), filename.length());
  
  //判断是否为doc文件
  if(filetype.equals("doc"))
  {
  System.out.println("当前正在转换......");
  //打印当前目录路径
  System.out.println(paths);
  //打印doc文件名
  System.out.println(filename.substring(0, (filename.length() - 4)));
  
  ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word
  
  String docpath = paths + filename;
  String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));
  
  String inFile = docpath;
  //要转换的word文件
  String tpFile = htmlpath;
  //HTML文件

  boolean flag = false;
  
  try
  {
  app.setProperty("Visible", new Variant(false));
  //设置word不可见


  Object docs = app.getProperty("Documents").toDispatch();
  Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
  //打开word文件
  Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
  //作为html格式保存到临时文件
  Variant f = new Variant(false);
  Dispatch.call(doc, "Close", f);
  flag = true;
  }
  catch (Exception e)
  {
  e.printStackTrace();
  }
  finally
  {
  app.invoke("Quit", new Variant[] {});
  }
  System.out.println("转化完毕!");
  }
  }
  else
  {
  pathss = paths;
  //进入下一级目录
  pathss = pathss + lists[i].getName() + "\\";    
  //递归遍历所有目录
  change(pathss, savepaths);
  }
  }
  
  }
  //---------------------------------------------------------
  //方法原型: main(String[] args)
  //功能描述: main文件
  //输入参数: 无
  //输出参数: 无
  //返 回 值: 无
  //其它说明: 无
  //----------------------------------------------------------  
  public static void main(String[] args)
  {
  
  String paths = new String("D:\\Work\\2004.10.8\\test system\\test01\\word\\");
  String savepaths = new String ("D:\\Work\\2004.10.8\\test system\\test01\\html\\");
  change(paths, savepaths);

  }
  }



  其中import的jar包是一个开源的东东,网上搜索即得。
  Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{ tpFile,new Variant(8)}, new int[1]);
  修改Variant(8)},里面得参数即可将Word转化为各种类型。



文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags: word HTML
相关日志:
评论: 0 | 引用: 0 | 查看次数: 228
发表评论
昵 称:
密 码: 游客发言不需要密码.
内 容:
验证码: 验证码
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.
字数限制 1000 字 | UBB代码 开启 | [img]标签 关闭