09-03

在Java中读写UTF-8编码文件的中文问题

作者:Java伴侣日期:2009-03-20

昨天下午写代码，需要生成一个XML文件，以取代原来那种HTML的碎片方式。但是写出来的文件用浏览器打开后都是乱码。我已经在XML的最前面加上了
<?xml version="1.0" encoding="UTF-8"?>
而且浏览器的编码也是UTF-8的，这就排除了浏览器的问题。
再用VIM打开，发现用GB2312看是没问题的，换成:set encoding=UTF-8以后开始乱码
这时我尝试将字符串转码后写入文件，但在UTF-8，GBK和ISO8859_1中间怎么转也没有用。
忽然想起前几天yiyayoyo同学和我提过Java写文件默认编码的问题，于是开始google，发现我用的写文件的方式无法指定编码，于是换用另一种写文件的方式指定UTF-8，遂搞定。代码如下：

老代码：
PrintWriter pw = new PrintWriter(new FileWriter(path));

Tags: UTF-8 UTF-8

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 600

08-08

04

编码为 UTF-8 的JSP 文件中出现非法字符问题

作者:Java伴侣日期:2008-08-04

在用 include 包含JSP 文件时发现最终生成的页面上会有多余的空白行，源代码中有个不能显示的字符，在查了一些文章后发现问题出在编辑器上。之前我用 Editplus 2.11 保存 JSP 文件为 UTF-8 编码，会在文件开始的地方插入三个不可见的字符（0xEF 0xBB 0xBF，即BOM），它的表示的是 Unicode 标记（BOM）。因此解决办法就是将代码保存的时候将 BOM 前面的勾去掉。可以用 EmEditor , Editplus 2.21 来保存。

表示 "ZERO WIDTH NO-BREAK SPACE"，更详细的请见
http://www.fileformat.info/info/unicode/char/feff/index.htm

发现问题的测试代码：
test.jsp
---------------------
<%@ page pageEncoding="UTF-8" %>

Tags: BOM BOM UTF-8 UTF-8

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 697

08-08

04

Java中对有BOM头的UTF-8文件的处理

作者:Java伴侣日期:2008-08-04

在用记事本之类的程序将文本文件保存为UTF-8格式时，记事本会在文件头前面加上几个不可见的字符（EF BB BF），就是所谓的BOM（Byte order Mark）。JDK1.5之前的Reader都不能处理BOM，解析这种格式的xml文件时，会抛出异常：Content is not allowed in prolog. 据说JDK1.6已经解决了这个bug。（参考http://www.uuzone.com/blog/mao/98921.htm ）
在未使用JDK1.6之前，解决办法有三：

引用内容

1、不要使用有BOM头的xml文件，就是说不要用记事本保存utf-8的xml文件，editplus就很好用；
2、使用这位仁兄的unicodereader，可以正确处理有BOM的xml文件：
http://koti.mbnet.fi/akini/java/unicodereader/
3、如果是用Xerces解析器，直接传Stream给Xerces，而不是传Reader，Xerces就可以正确的处理了。总之不要用Reader就好了。

Tags: BOM BOM UTF-8 UTF-8

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 775

08-05

13

UTF-8导入MYSQL中文无显示

作者:Java伴侣日期:2008-05-13

今天把本地的MYSQL数据导出到web service，结果发现中文字符全不见了。配置如下：

复制内容到剪贴板

程序代码

导出数据库5.0.45。字符集:UTF-8
导入数据库数据库5.0.22，也是UTF-8

结果发现是phpadmin版本不兼容，以至于导出数据出现问题，使用mysqldump指令进行导出。

复制内容到剪贴板

程序代码

mysqldump -uroot -p123456 thfxw>d:\ym.sql

Tags: 中文中文无显示无显示 UTF-8 UTF-8

分类:Database | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 865

08-04

29

utf-8转unicode

作者:Java伴侣日期:2008-04-29

/**
  * utf-8 转换成 unicode
  * @author fanhui
  * 2007-3-15
  * @param inStr
  * @return
  */
public static String utf8ToUnicode(String inStr) {
        char[] myBuffer = inStr.toCharArray();

Tags: UTF-8 UTF-8 unicode unicode

分类:学习 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 1711

08-01

26

UTF-8...

作者:Java伴侣日期:2008-01-26

弄了一上午,怎么看代码也没有发现问题.可是输出到服务器,html就是乱码,我纳闷死了,乖乖的~
到了下午也没办法解决,要命的错误.无奈下就在服务器文件下左点点右点点,发现模版竟然是Ansi编码的,另存为UTF-8的,问题解决了...它姥姥的!!

Tags: UTF-8 UTF-8

分类:Java&Jsp | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 617

在Java中读写UTF-8编码文件的中文问题

作者:Java伴侣日期:2009-03-20

编码为 UTF-8 的JSP 文件中出现非法字符问题

作者:Java伴侣日期:2008-08-04

Java中对有BOM头的UTF-8文件的处理

作者:Java伴侣日期:2008-08-04

UTF-8导入MYSQL中文无显示

作者:Java伴侣日期:2008-05-13

utf-8转unicode

作者:Java伴侣日期:2008-04-29

UTF-8...

作者:Java伴侣日期:2008-01-26

Search

SweetTitles

Category

User Panel

Recent Comments

Statistics

Archive

Links

在Java中读写UTF-8编码文件的中文问题

作者:Java伴侣 日期:2009-03-20

编码为 UTF-8 的JSP 文件中出现非法字符 ﻿ 问题

作者:Java伴侣 日期:2008-08-04

Java中对有BOM头的UTF-8文件的处理

作者:Java伴侣 日期:2008-08-04

UTF-8导入MYSQL中文无显示

作者:Java伴侣 日期:2008-05-13

utf-8转unicode

作者:Java伴侣 日期:2008-04-29

UTF-8...

作者:Java伴侣 日期:2008-01-26

Search

SweetTitles

Category

User Panel

Recent Comments

Statistics

Archive

Links

作者:Java伴侣日期:2009-03-20

编码为 UTF-8 的JSP 文件中出现非法字符问题

作者:Java伴侣日期:2008-08-04

作者:Java伴侣日期:2008-08-04

作者:Java伴侣日期:2008-05-13

作者:Java伴侣日期:2008-04-29

作者:Java伴侣日期:2008-01-26