当前位置: 首页 > wzjs >正文

环江建设网站沧州网站优化

环江建设网站,沧州网站优化,网站推广计划书模板,公司做网站一般要多少钱问题 项目上遇到一个很离谱的问题,json如下: {"Place": "北滘" }这是一个正常的json,他的编码是GB2312,可是我的代码在解析json时报错,代码如下: // 判断是否为GB2312编码 bool isG…

问题

项目上遇到一个很离谱的问题,json如下:

{"Place": "北滘"
}

这是一个正常的json,他的编码是GB2312,可是我的代码在解析json时报错,代码如下:

// 判断是否为GB2312编码
bool isGb2312(const QByteArray &data) {QTextCodec *codec = QTextCodec::codecForName("GB2312");if (!codec)return false;QString decodedString = codec->toUnicode(data);QByteArray encodedData = codec->fromUnicode(decodedString);return data == encodedData;
}QJsonParseError parseError;bool ParseJsonVerson(QByteArray pBody, QString &strErrMsg){if(isGb2312(fileJsonData)){QTextCodec *codec = QTextCodec::codecForName("GB2312");if (codec) pBody = codec->toUnicode(pBody).toUtf8();}QJsonDocument jsonDoc = QJsonDocument::fromJson(pBody, &parseError);if (jsonDoc.isNull()) {bRet = false;strErrMsg = "解析失败,不是完整的json11!";qWarning() << "Failed to create JSON document:" << parseError.errorString();return bRet;}//json处理....
}

这里运行时,jsonDoc.isNull()=true
一脸懵逼,没办法单步进去查看,发现它判断的json编码不是"GB2312"
!!!!
继续查,发现我把“滘”字删掉就正常了!???
直接定位“滘”字细节如下:
单纯的“滘” 他的16进制数据是 0x9C 0xF2
在这里插入图片描述

调用bool isGb2312(const QByteArray &data)接口:
在这里插入图片描述
这里明显发现不对了,转换回来失败了!

我们使用“好”字再来测试:
在这里插入图片描述

QString decodedString = codec->toUnicode(data);做了什么?

QTextCodec::toUnicode

QTextCodec::toUnicode 方法的实现涉及将字节数组(QByteArray)转换为 QString。在 Qt 中,QTextCodec 是一个抽象类,负责处理不同字符编码之间的转换。具体到 GB2312 编码,toUnicode 方法的实现过程大致如下:

  1. 字节解析:首先,toUnicode 方法会读取输入的字节数组,并根据 GB2312 编码的规则解析字节。GB2312 是一个双字节编码,字符的表示通常由两个字节组成。

  2. 字符映射:对于每一对字节,toUnicode 会查找 GB2312 字符集中的对应字符。如果字节对在 GB2312 字符集中存在,则返回相应的 Unicode 字符。

  3. 错误处理:如果输入的字节数组包含无效的字节序列(例如,单独的字节或不在 GB2312 字符集中的字节对),toUnicode 方法会返回一个替代字符(通常是 U+FFFD,即 “�”),表示无法识别的字符。这就是你在调用 toUnicode 时得到 0xFFFD 的原因。

返回结果:最后,toUnicode 方法将所有有效的字符组合成一个 QString 并返回。

问题定位了,QTextCodec::toUnicode 没能成功将“滘”字转换成Unicode。查询了一下GB2312字符集中没有“滘”这个字‌!!!
0x9C 0xF2 编码表示的是汉字“滘”,属于GBK编码!!!

解决办法:

 // 检测文件编码QString detectEncoding(QByteArray data) {if (isUtf8(data)) {return "UTF-8";} else if (isGb2312(data)) {return "GB2312";} else if (isGbkEncoded(data)){return "GBK";}else {return "Unknown";}
}
bool ParseJsonVerson(QByteArray pBody, QString &strErrMsg){if(strCode=="Unknown"){strErrMsg = "解析失败,未知编码!";qWarning() << "Failed to create JSON document:" << parseError.errorString();return bRet;}else if(strCode=="GB2312"){QTextCodec *codec = QTextCodec::codecForName("GB2312");if (codec) {pBody = codec->toUnicode(pBody).toUtf8();}}else if(strCode=="GBK"){QTextCodec *codec = QTextCodec::codecForName("GBK");if (codec) {pBody = codec->toUnicode(pBody).toUtf8();}}QJsonDocument jsonDoc = QJsonDocument::fromJson(pBody, &parseError);if (jsonDoc.isNull()) {bRet = false;strErrMsg = "解析失败,不是完整的json11!";qWarning() << "Failed to create JSON document:" << parseError.errorString();return bRet;}//json处理....
}

注:如果咱之前统一编码,全部用UTF8也就没这茬儿了。总结,蛋疼。

http://www.dtcms.com/wzjs/399677.html

相关文章:

  • 为推广网站做的宣传活动登封网站关键词优化软件
  • 免费建网站.com的区别如何自己开发软件app
  • wordpress选择文章模板seo基础培训教程
  • 沈阳做网站的企业软件外包公司排名
  • 福州整站优化建站系统有哪些
  • 做破解的网站营销模式有哪些 新型
  • 宽屏营销型网站源码网站开发建设步骤
  • 深圳网站设计 建设首选深圳市吉安seo招聘
  • 建立自己的网站用花钱吗网络营销最基本的应用方式是什么
  • 英国小子做房产网站推广普通话宣传语手抄报
  • 做个人网站怎么自己弄一个网站
  • 交互式网站设计网站建设哪家好
  • 湛江建站模板蜜雪冰城网络营销案例分析
  • 做跨境电商的步骤搜索引擎优化的简称是
  • 建设网站包括哪些成免费的crm
  • 咸阳做网站的公司电话上海培训机构白名单
  • 营销云官网seo综合查询软件排名
  • 建设手表网站的目的名站在线
  • 建设街小学网站最近热点新闻事件2023
  • wordpress可以做电影网站吗nba新闻最新消息
  • b2c是指什么的电子商务模式seo免费系统
  • 做科普网站优化网站排名茂名厂商
  • 电商平台网站制作费用长沙网站优化推广方案
  • 电影新网站如何做seo优化运营网站是什么意思
  • 成都网站seo排名地推拉新app推广接单平台
  • 冒充it男给某网站做修复网址收录平台
  • 外贸选品网站网络营销个人感悟小结
  • 前台网站开发做电商需要学哪些基础
  • 青岛网站建设平台公司如何做网络推广营销
  • wordpress用户注册数据库泰安网站建设优化