300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > Qt字符串中文乱码问题(编码问题)

Qt字符串中文乱码问题(编码问题)

时间:2019-01-25 08:20:14

相关推荐

Qt字符串中文乱码问题(编码问题)

在做图书管理系统时,有一个功能需要用到QTableWidget来输出字符串,文件里的数据如图所示:

tableWdiget输出的数据如图所示:

经过查阅资料,作出以下总结:

1.一般字符串本身是ASCII码的数组,但是中文用的是GBK编码。

2.关于GBK

以下为查阅百度所得资料:

当字符小于127位时,与ASCII的字符相同,但当两个大于127的字符连接在一起时,就代表一个汉字,第一个字节称为高字节(从0xA1-0xF7),第二个字节为低字节(从0xA1-0xFE),这样大约可以组合7000多个简体汉字。这个规则叫做GB2312。

GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE,剔除xx7F码位,共23940个码位。共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日正式发布,这一版的GBK规范为1.0版。

(资料来源/zh/hanzi-gbk-bianma.php)

3.QString对字符串的操作

举例

QString str = "Hello World";

其中,传递给QString一个const char* 类型的ASCII字符串“Hello World”,这将会导致调用QString构造函数,来初始化一个QString字符串。其构造函数原型为:

QT_ASCII_CAST_WARN_CONSTRUCTOR QString::QString(const char* str)

被传递的const char* 类型的指针又将被函数QString::fromAscii()转换为Unicode编码。默认情况下,函数QString::fromAscii()会将超过128的字符作为Latin-1进行处理。(个人认为这是出现中文乱码的原因,因为中文字符都超过128)

解决方法有三:

方法一:

Qt使用Unicode来存储、绘制和操作字符串。

Qt提供了一组QTextCodec类来帮助在Unicode和非Unicode格式之间进行转换。

首先定义一个全局变量:

QTextCodec* gbk_codec = QTextCodec::codecForName("GBK");

解释:中文字符以GBK格式存储。因此要使用QTextCodec类来进行GBK与Unicode格式之间进行转换。

之后:

QString str_2 = gbk_codec->toUnicode( "中文字符串" );

使用对象调用方法,从而实现转换。

修改之后如图所示:

注意,如果是从文件中读取字符串,一定要把文件编码改为ASCII。

方法二:

可以通过调用QTextCodec::setCodecForCString()函数改变QString::fromAscii()函数的处理方式。

方法三:

可以通过定义QT_CAST_FROM_ASCII宏变量屏蔽该构造函数。如果程序员要求显示给用户的字符串都必须经过QObject::tr()函数的处理,那么屏蔽QString的这个构造函数是非常有用的。

ps:这里推荐方法一,因为方法二和三是从陆文周《Qt5开发及实例》中借鉴而来,未经过实践。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。