clickhouse及gbase中文字段导出的问题

发布时间 2023-10-09 15:50:09作者: 剑道第一仙

【1】clickhouse及gbase中文字段导出可能出现换行或者乱码等情况

导出时可以使用正则表达式替换特殊字符

clickhouse:
replace(replace(replaceRegexpAll(substring(coalesce(XXXX,''),1,2),'"|\'|\\|/| |\|',''),char(10),''),char(13),'')
gbase:
replace(replace(regexp_replace(substring(coalesce(XXXX,''),1,2),'"|\'|\\|/| |\|',''),char(10),''),char(13),'')

【2】gbase导出数据到文件时,默认可能会是ANSI格式,中文导入其他utf8字符集数据库时会乱码,需要设置导出utf8格式文件

rmt:select * from tablename into outfile 'xxx.unl' character set utf8 fields terminated by '|';