萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 745|回复: 0

1-1-16-1-10 solaris上开发J2EE应用中文问题的解决

[复制链接]
发表于 2003-2-8 00:52 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
发信人: VRGL (面向鸡蛋的火鸡), 信区: Java      
标  题: solaris上开发J2EE应用中文问题的解决
发信站: BBS 水木清华站 (Thu Oct  4 10:04:00 2001)

关于JSP和J2EE的中文问题和处理方法,网上已经有很多文章。一般在中文内核的操作系
统(如中文NT,windows2000)上,该问题不是很突出,而在其他一些系统(如linux,s
olaris)中就比较明显了。近日在solaris上开发一个J2EE的应用系统,环境是solaris
2.7+minij2ee+mysql。系统在windows和linux下均没有出现中文处理的问题,但部署到
solaris上面后所有中文显示为?。
后来经过分析,发现原因出在系统编码上。由于安装solaris时默认的系统编码为ASCI
I,因此以默认的系统编码处理字符串时汉字高位信息丢失。下面一段简单的jsp程序说
明了这个问题:
<%@ page contentType="text/html;charset=gb2312"%>
<%
String str=request.getParameter("i");
//byte[] b=str.getBytes("iso-8859-1");
byte[] b=str.getBytes();
out.println(new String(b,"gb2312"));
%>
在浏览器中输入foo.jsp?i=中文,结果显示为??。如果将byte[] b=str.getBytes();换
成上面注释掉的byte[] b=str.getBytes("iso-8859-1");,则正常显示出“中文”二字
。查阅了mysql JDBC的驱动程序,问题相同。
考虑解决的方法有两个,一个是修改JDBC驱动程序,另一个是将汉字编码成7位,从实现
方便的角度选择了后者。不过后者的缺点是字符串长度增加,并且无法直接通过sql工具
来修改数据库了。网上有一种汉字编码的方法,是将汉字高位去1,英文则补一个0表示
。这种方法有缺陷,因为特定的汉字编码后会出现“'”等SQL语句中有歧义的字符,导
致sql失败。我摘取了minij2ee中uniString的编码方法,该方法将字节表示为其16进制
编码,下面是源代码:

  1. public String encode()
  2. {
  3. try
  4. {
  5.   StringBuffer sb=new StringBuffer();
  6.   byte[] bytes=m_enc.compareTo("")==0?m_str.getBytes():m_str.getBytes(m_enc)
  7. ;
  8.   for(int i =0;i<bytes.length;i++)
  9.   {
  10.    char ch;
  11.    ch=Character.forDigit((bytes[i]>>4)&0xF,16);
  12.    sb.append(ch);
  13.    ch=Character.forDigit(bytes[i]&0xF,16);
  14.    sb.append(ch);
  15.   }
  16.   return sb.toString();
  17. }
  18. catch(java.io.UnsupportedEncodingException e)
  19. {
  20.   throw new RuntimeException("Unsupported encoding type.");
  21. }
  22. }
  23. public void decode(String encodestr)
  24. {
  25. StringBuffer sb=new StringBuffer();
  26. int i=0;
  27. while(i!=encodestr.length())
  28. {
  29.   sb.append((char)Integer.parseInt(encodestr.substring(i,i+2),16));
  30.   i+=2;
  31. }
  32. m_str=new uniString(sb.toString(),"iso-8859-1").cvt(m_enc);
  33. }
复制代码

使用编码后,问题解决。
另外提一下,minij2ee最新版本中提供一个uniString类,解决了在所有操作系统上的
中文问题。使用uniString对象,无需关心字符串本身编码,使用时只要调用函数来获得
需要的编码即可,如在jsp里调用uniString.gb()即可以以gb2312输出字符串,在数据库
存储时调用uniString.iso()即可以以iso-8859-1编码输出字符串,无论在中文内核还是
英文内核的操作系统上均通用。
更多的技术文档,尽在minij2ee技术文档中心,请访问 http://www.minij2ee.com/doc
ument/ 。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网 |网站地图

GMT+2, 2024-6-3 15:33 , Processed in 0.052983 second(s), 16 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表