Java出现个别中文字符乱码问题


如果你发现HttpClient获取下来的内容个别字符是乱码的,别慌,这种情况很可能页面编码是GB2312的,但是某个汉字编码不在GB2312里面,所以采用GBK或者GB18030对字符串进行处理就行了,另外这种情况不要使用EntityUtils.toString去处理,因为它内部实现有个1024的buffer操作,毕竟老外写得库,不会考虑中文。使用BufferedReader按行读取,或者使用ByteArrayOutputStream一次性全部读取再进行字符串编码处理。


内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.11000011.com/?id=15

« 上一篇 下一篇 »

我要评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

主机推荐

  • 搬瓦工