Tag: UTF-8预览模式: 普通 | 列表
09-03
20

在Java中读写UTF-8编码文件的中文问题

昨天下午写代码,需要生成一个XML文件,以取代原来那种HTML的碎片方式。但是写出来的文件用浏览器打开后都是乱码。我已经在XML的最前面加上了
<?xml version="1.0" encoding="UTF-8"?>
而且浏览器的编码也是UTF-8的,这就排除了浏览器的问题。
再用VIM打开,发现用GB2312看是没问题的,换成:set encoding=UTF-8以后开始乱码
这时我尝试将字符串转码后写入文件,但在UTF-8,GBK和ISO8859_1中间怎么转也没有用。
忽然想起前几天yiyayoyo同学和我提过Java写文件默认编码的问题,于是开始google,发现我用的写文件的方式无法指定编码,于是换用另一种写文件的方式指定UTF-8,遂搞定。代码如下:

老代码:
PrintWriter pw = new PrintWriter(new FileWriter(path));

查看更多...

Tags: UTF-8

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 544
08-08
04

编码为 UTF-8 的JSP 文件中出现非法字符  问题

在用 include 包含JSP 文件时发现最终生成的页面上会有多余的空白行,源代码中有个不能显示的字符,在查了一些文章后发现问题出在编辑器上。之前我用 Editplus 2.11 保存 JSP 文件为 UTF-8 编码,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM),它的表示的是 Unicode 标记(BOM)。因此解决办法就是将代码保存的时候将 BOM 前面的勾去掉。可以用 EmEditor , Editplus 2.21 来保存。

 表示 "ZERO WIDTH NO-BREAK SPACE",更详细的请见
http://www.fileformat.info/info/unicode/char/feff/index.htm

发现问题的测试代码:
test.jsp
---------------------
<%@ page pageEncoding="UTF-8" %>

查看更多...

Tags: BOM UTF-8

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 653
08-08
04

Java中对有BOM头的UTF-8文件的处理

在用记事本之类的程序将文本文件保存为UTF-8格式时,记事本会在文件头前面加上几个不可见的字符(EF BB BF),就是所谓的BOM(Byte order Mark)。JDK1.5之前的Reader都不能处理BOM,解析这种格式的xml文件时,会抛出异常:Content is not allowed in prolog. 据说JDK1.6已经解决了这个bug。(参考http://www.uuzone.com/blog/mao/98921.htm
在未使用JDK1.6之前,解决办法有三:
引用内容 引用内容
1、不要使用有BOM头的xml文件,就是说不要用记事本保存utf-8的xml文件,editplus就很好用;
2、使用这位仁兄的unicodereader,可以正确处理有BOM的xml文件:
http://koti.mbnet.fi/akini/java/unicodereader/
3、如果是用Xerces解析器,直接传Stream给Xerces,而不是传Reader,Xerces就可以正确的处理了。总之不要用Reader就好了。

Tags: BOM UTF-8

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 723
08-05
13

UTF-8导入MYSQL中文无显示

   今天把本地的MYSQL数据导出到web service,结果发现中文字符全不见了。配置如下:
  导出数据库5.0.45。字符集:UTF-8
    导入数据库数据库5.0.22,也是UTF-8

   结果发现是phpadmin版本不兼容,以至于导出数据出现问题,使用mysqldump指令进行导出。
  
mysqldump -uroot -p123456 thfxw>d:\ym.sql

查看更多...

Tags: 中文 无显示 UTF-8

分类:Database | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 813
08-04
29

utf-8转unicode

/**
  * utf-8 转换成 unicode
  * @author fanhui
  * 2007-3-15
  * @param inStr
  * @return
  */
public static String utf8ToUnicode(String inStr) {
        char[] myBuffer = inStr.toCharArray();

查看更多...

Tags: UTF-8 unicode

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 1652
08-01
26

UTF-8...

     弄了一上午,怎么看代码也没有发现问题.可是输出到服务器,html就是乱码,我纳闷死了,乖乖的~
     到了下午也没办法解决,要命的错误.无奈下就在服务器文件下左点点右点点,发现模版竟然是Ansi编码的,另存为UTF-8的,问题解决了...它姥姥的!!

查看更多...

Tags: UTF-8

分类:Java&Jsp | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 564