当前位置：首页 > news >正文

oracle19C(ZHS16GBK - 简体中文字符集) 数据库迁移到 oracle19C(AL32UTF8 - Unicode字符集)数据库方案

news 2025/8/27 12:49:14

背景

系统一直使用的oracle19C(ZHS16GBK - 简体中文字符集) 版本，项目上由于多个产品线共用一个数据库实例，其他产品都是oracle19C(AL32UTF8 - Unicode字符集)，如果使用impdp导入 gbk编码的dmp文件，由于gbk一个中文占用两个字节、utf8一个中文占用3个字节，导入过程会有大量会报错数据截断错误。

ZHS16GBK AL32UTF8字符集介绍

ZHS16GBK - 简体中文字符集介绍

编码结构：

扩展GB2312标准，支持21003个汉字
双字节编码(0x8140-0xFEFE)
兼容ASCII(0x00-0x7F单字节)

字符范围：

简体中文(GB 18030-2000基本集)
常见繁体字
中文标点符号(全角)
部分日文假名和特殊符号

局限性：

不支持越南语、泰语等东南亚文字
部分生僻字可能无法显示

AL32UTF8 - Unicode字符集

核心优势：

完整Unicode支持(最新版本)
可变长度编码(1-4字节/字符)
兼容所有语言字符

编码方式：

ASCII字符：1字节(0x00-0x7F)
欧洲文字：通常2字节(如é: 0xC3A9)
中文/日文/韩文：通常3字节(中: 0xE4B8AD)
特殊符号/罕见字：4字节

数据库迁移方案

从utf8编码存储，一个中文占用3个字节，gbk占用两个字节编码入手，把数据库指定用户下所有的varchar、char字段加长1.5倍，如果加长1.5倍后长度大于4000，则最大取4000，因oracle数据库最大长度只支持4000，如果数据库里的内容已经超过大小导入时只有截断，后面换成clob字段单独处理；

另外我还考虑到一个问题，char是固定长度类型，如故char增加1.5倍长度，会导致存储的内容增加空格补足，很多程序查询数据库char字段没做处理，查询到的数据会带很多空格，所以我是想到批量把该用户下所有char字段先改为varchar字段。

迁移步骤

一、先把数据库指定用户导出，重新创建表空间、用户导入到数据库实例，如果直接在开发数据库操作，出问题比较麻烦

从10.19.40.40 导出门户和体检库

# 表空间 BBPNEW_SPACE
expdp C##BBPNEW/Bsoft123 schemas=C##BBPNEW dumpfile=20250614BBPNEW.dmp # 表空间 CYTJ410_SPACE
expdp C##BBP402CYTJDEV41/Bsoft123 schemas=C##BBP402CYTJDEV41 dumpfile=20250614BBP402CYTJDEV41.dmp

创建C##BBPNEWSTD，C##BBP402CYTJDEV41STD用户，BBPNEW_SPACE_STD，CYTJ410_SPACE_STD表空间

表空间、用户名加STD为标准的含义

# 创建bbp表空间用户
CREATE TABLESPACE  BBPNEW_SPACE_STD
DATAFILE  '/data/oradata/BBPNEW_SPACE_STD.dbf'SIZE

查看全文

http://www.dtcms.com/a/250020.html

《Apollo 配置中心在动态主题系统中的设计与扩展》

区间合并：牛奶

错题分析接口实现全流程

Flink 与 Hive 深度集成

【系统分析师】第5章-基础知识：数据库系统（核心总结）

Oracle 单实例双IP配置

List的简单模拟实现

树莓派智能小车基本移动实验指导书

SSH参数优化与内网穿透技术融合：打造高效远程访问解决方案

[CVPR 2025] DiCo：动态协作网络助力半监督3D血管分割新突破

Java开发中避免NullPointerException的全面指南

RabbitMQ--集群

java设计模式[2]之创建型模式

学习设计模式《十三》——迭代器模式

C++线性DP-最优解问题、方案数问题

Design Compiler：解组(Ungroup)

自编码模型原理

Python中提取图片特征的指南

2.2 订阅话题

在Ubuntu linux终端写文件的方法

DataWhale-零基础网络爬虫技术（一）

互联网大厂Java求职面试：云原生架构与微服务设计中的复杂挑战

sql列中数据通过逗号分割的集合，对其中的值进行全表查重

Unity 对象层级处理小结

关于allegro 导入网表报错：Unable to find pin name in问题的解决

Java 复习题选择题（1）（Java概述）

三维重建 —— 5. 双目立体视觉

多线程与多进程技术全景对比

Docker 部署 RomM 指南：打造私有戏库与即点即玩系统

基于“数智立体化三维架构”框架的医疗数智化机制研究

背景