文章詳情頁

Java中文相關(guān)技術(shù)

瀏覽：5日期：2024-06-22 09:17:13

內(nèi)容: 在應(yīng)用開發(fā)的過程中，總會遇到一些“難以理解的系統(tǒng)缺陷和“不易解決的問題。其實，通過認(rèn)真分析，不必購買昂貴的產(chǎn)品依然可以解決多數(shù)問題。■JDBC ODBC Bridge的Bug及其解決方法在編寫一數(shù)據(jù)庫管理程序時，發(fā)現(xiàn)JDBC-ODBC Bridge存在不易發(fā)現(xiàn)的Bug。在向數(shù)據(jù)表插入數(shù)據(jù)時，如果為英文字符，存儲內(nèi)容完全正確，如果存入中文字符，部分?jǐn)?shù)據(jù)庫只能存儲前七八個中文字符，其他內(nèi)容被截去，導(dǎo)致存儲內(nèi)容的不完整（有些數(shù)據(jù)庫不存在這個問題，如Sybase SQL Anywhere 5.0。JDBC-ODBC Bridge還存在無法建表的Bug）。對于廣大需要存儲中文信息的Java程序員來說，這可是一個不好的消息。要么改用其他語言編程，要么選擇其他價格昂貴的數(shù)據(jù)庫產(chǎn)品。“一次編寫，到處運(yùn)行的目標(biāo)，也大打折扣。能不能采用變通的方法，將中文信息進(jìn)行處理后再存儲來解決這個問題呢？答案是肯定的。解決問題的具體思路、方法Java采用Unicode碼編碼方式，中英文字符均采用16bit存儲。既然存儲英文信息是正確的，根據(jù)一定規(guī)則，將中文信息轉(zhuǎn)換成英文信息后存儲，自然不會出現(xiàn)截尾現(xiàn)象。讀取信息時再進(jìn)行逆向操作，將英文信息還原成中文信息即可。由GB2312編碼規(guī)則可知，漢字一般為二個高位為1的ASCII碼，在轉(zhuǎn)換時將一個漢字的二個高位1去掉，還原時再將二個高位1加上。為了處理含有英文字符的中文字串，對英文字符則需要加上一個Byte 0標(biāo)記。以下提供的兩個公用靜態(tài)方法，可加入任何一個類中使用。將中英文字串轉(zhuǎn)換成純英文字串public static String toTureAsciiStr(String str){StringBuffer sb = new StringBuffer();byte[] bt = str.getBytes();for(int i =0 ;i〈btelse{//是英文字符補(bǔ)0作記錄sb.append((char)0);sb.append((char)bt[i]); } }return sb.toString();}將經(jīng)轉(zhuǎn)換的字串還原public static String unToTrueAsciiStr(String str){ byte[] bt = str.getBytes(); int i,l=0,length = bt.length,j=0; for(i = 0;i〈length;i++){ if(bt[i] == 0){ l++; } } byte []bt2 = new byte[length-l]; for(i =0 ;i〈length;i++){ if(bt[i] == 0){ i++; bt2[j] = bt[i]; }else{ bt2[j] = (byte)(bt[i]|0x80); } j++; }String tt = new String(bt2);return tt;}上例在實際編程中效果很好，只是存儲的中文信息需要經(jīng)過同樣處理，才能被其他系統(tǒng)使用。而且如果中文字串出現(xiàn)英文字符，實際上增加了額外的存儲空間?！鯯olaris下Servlet編程的中文問題及解決辦法在使用Java開發(fā)Internet上的一個應(yīng)用系統(tǒng)時，發(fā)現(xiàn)在Windows下調(diào)試完全正常的Servlet，上傳到Solaris 服務(wù)器上，運(yùn)行卻出現(xiàn)故障——返回的網(wǎng)頁不能顯示中文，應(yīng)為中文的信息全為亂碼；用中文信息做關(guān)鍵字，不能正確檢索數(shù)據(jù)庫。后來采用加入檢查代碼等方法探知故障原因如下：顯示亂碼主要是因為通過類 HttpServletResponse提供的方法setContentType 無法改變返回給客戶的數(shù)據(jù)的編碼方式，正確的編碼方式應(yīng)為GB2312或者GBK，而事實上為缺省的ISO8859-1。無法檢索中文信息則是因為，客戶提交的中文信息經(jīng)瀏覽器編碼到達(dá)服務(wù)器后，Servlet無法將其正確解碼。舉例說明顯示亂碼解決方法Servlet 一般通常做法如下：public class ZldTestServlet extends HttpServlet {public void doGet (HttpServletRequest request,HttpServletResponse response)throws ServletException, IOException{//在使用 Writer向瀏覽器返回數(shù)據(jù)前，設(shè)置 content-type header ，在這里設(shè)置相應(yīng)的字符集gb2312response.setContentType('text/html;charset=gb2312');PrintWriter out = response.getWriter(); //*// 正式返回數(shù)據(jù)out.println('〈html〉〈head〉〈title〉Servlet test〈/title〉〈/head〉' )out.println('這是一個測試頁！');out.println('〈/body〉〈/html〉');out.close();} ...}解決頁面顯示亂碼問題，需將*處代碼換成如下內(nèi)容：PrintWriter out = new PrintWriter(new OutputStreamWriter(response.getOutputStream(),'gb2312'));Solaris中文信息檢索問題的解決瀏覽器利用表單向服務(wù)器提交信息時，一般采用x-www-form-urlencoded 的MIME格式對數(shù)據(jù)進(jìn)行編碼。如果使用get方法，參數(shù)名稱和參數(shù)值經(jīng)編碼后附加在URL后，在Java中稱作查詢串（query string）。在Servlet程序中，如果采用ServletRequest的方法getParameter取得參數(shù)值，在Solaris環(huán)境下，對漢字卻不能正確解碼。因而無法正確檢索數(shù)據(jù)庫。在Java 1.2的包——java.net中提供了URLEncode和URLDecode類。類URLEncode提供了按x-www-form-urlencoded格式對給定串進(jìn)行轉(zhuǎn)換的方法。類URLEncode則提供了逆方法。在編寫某網(wǎng)上114查詢的Servlet時，采用先取得查詢串，再利用類URLDecode解碼，再從解碼后的串中取得參數(shù)，很好地解決了Solrais環(huán)境下，中文信息檢索的問題。源代碼就不在這里給出了，如果需要請和筆者聯(lián)系。 Java, java, J2SE, j2se, J2EE, j2ee, J2ME, j2me, ejb, ejb3, JBOSS, jboss, spring, hibernate, jdo, struts, webwork, ajax, AJAX, mysql, MySQL, Oracle, Weblogic, Websphere, scjp, scjd

Java

上一條：使用Java實現(xiàn)網(wǎng)絡(luò)傳輸數(shù)據(jù)的壓縮下一條：理解java的多形性

相關(guān)文章：

1. 舊題新貌:PHP截取中文字符串的問題2. 詳解python中文編碼問題3. php代碼優(yōu)化及php相關(guān)問題總結(jié)4. Java繁體中文處理完全攻略（二）5. PHP擴(kuò)展之字符編碼相關(guān)函數(shù)1——iconv6. Python數(shù)據(jù)模型與Python對象模型的相關(guān)總結(jié)7. JavaScript數(shù)組類型Array相關(guān)的屬性與方法詳解8. IntelliJ Idea 2020.1 正式發(fā)布,官方支持中文（必看）9. PHP擴(kuò)展之字符串編碼相關(guān)函數(shù)2——多字節(jié)字符串10. AndroidStudio4.0日志中文亂碼問題

排行榜

					
					python openpyxl 帶格式復(fù)制表格的實現(xiàn)
Python獲取瀏覽器窗口句柄過程解析
Python如何將字符串轉(zhuǎn)換為日期
Python sorted對list和dict排序
Python 如何將integer轉(zhuǎn)化為羅馬數(shù)(3999以內(nèi))
python 浮點(diǎn)數(shù)四舍五入需要注意的地方
Python使用shutil模塊實現(xiàn)文件拷貝
python 實現(xiàn)aes256加密
Python用K-means聚類算法進(jìn)行客戶分群的實現(xiàn)
Python 下載Bing壁紙的示例
Python 如何用一行代碼實現(xiàn)for循環(huán)初始化數(shù)組