ABAP 调用HTTP上传附件(二)之中文乱码

发布时间 2023-03-22 19:15:16作者: 斌将军

1、这篇文章的由来

之前已经发表了《ABAP 调用HTTP上传附件》的文章,详细介绍了如何通过HTTP请求传输附件,可点击链接参考原有文档

因为之前对传输文件的中文文件名处理上解释不够详细,也因为不够重视,导致又一次在相关问题上踩坑。而浪费一天时间的问题,最终原因竟然就是个这?哭笑不得!目瞪口呆!

为以上缘由,也因为只有“身体力行”的研究,才会更加深入的学习问题相关的知识,才能优化自己解决问题的思路和方法,无论这个方法论是“经验所得”还是他人的“言传身教”,都是比解决问题本身更有价值的收获。

所以写这篇文档,介绍一下解决中文乱码问题的整个过程。

2、详细说明

2.1、问题背景

在《ABAP 调用HTTP上传附件》文章中对于中文乱码问题已经做了解释:

"拼接上传的文件名,并将文件名转码
  lv_name = i_filename.
  lv_name = cl_http_utility=>escape_url( lv_name ).
  lv_value = 'form-data; name="file"; filename="' && lv_name && '";'.

此代码cl_http_utility=>escape_url( lv_name )的作用是将中文转码:

转换前:'测试文件.txt'.
转换后:%e6%b5%8b%e8%af%95%e6%96%87%e4%bb%b6.txt

但是上传的文件名全部变成了如图所示

 

直接发送中文名称,并在HTTP中设置UTF-8,没有解决问题,所以只能继续在转码上研究

2.2、解决过程

2.2.1、发现异常

在POSTMAN中上传文件测试正常。

因为此接口经过CPI,在POSTMAN中没有发现有价值信息,而在CPI中发现了POSTMAN上传和代码上传的日志有所不同

POSTMAN:

Content-Disposition: form-data; name="file"; filename="测试文件.txt"; 
filename*=UTF-8''%E6%B5%8B%E8%AF%95%E6%96%87%E4%BB%B6.txt

代码调用:

content-disposition: form-data; name="file"; filename="%e6%b5%8b%e8%af%95%e6%96%87%e4%bb%b6.txt";

除了POSTMAN调用时多了filename*用来将文件名转换为UTF-8的中文名外,对应的中文文件名编码,一个字母全部大写,一个字母全部小写……

因为JAVA环境调用正常,所以在JAVA环境中代码模拟:

URI uri = null;
try {
    uri = new URI(null, null, "测试文件.txt", null);
} catch (URISyntaxException e) {
    e.printStackTrace();
}
String fileName = uri.toASCIIString();
System.out.println(fileName);

结果:
%E6%B5%8B%E8%AF%95%E6%96%87%E4%BB%B6.txt

至此,回想起研究RSA加密时,也发现了ABAP中用此方法直接转换编码时,得到的ASCII值为小写。而当前对接的外围系统无法解析字母为小写的这串编码,所以最终上传的文件名就都变成了编码符号,真相大白!真相大白!真相大白!

2.2.2、解决问题

开始研究ABAP的编码转换方法:

1、直接转大写

除了过于简单粗暴外,还需要截取字符串,否则将文件后缀也变成了大写,如TXT,XLSX等,额……对于强迫症患者,还是算了

2、函数www_urlencode

函数转换完,扩展名的“.”都被转换了。额……继续研究

3、预定义函数escape

此函数可以通过定义format = cl_abap_format=>e_url_full,得出和Java代码中同样的效果,其实cl_abap_format=>e_uri_full在此处也满足需求,两者在符号“+”、“*”、“~”上有转换区别

lv_name = escape( val = lv_name format = cl_abap_format=>e_url_full ).

几种编码测试对比:

一、
lv_name = '测试文件.txt'.
DATA(lv_name1) = escape( val = lv_name format = cl_abap_format=>e_uri_full ).
DATA(lv_name2) = escape( val = lv_name format = cl_abap_format=>e_url_full ).
DATA(lv_name3) = cl_http_utility=>escape_url( lv_name ).
WRITE:/ 'escape e_uri_full:' && lv_name1.
WRITE:/ 'escape e_url_full:' && lv_name2.
WRITE:/ 'escape_url    小写:' && lv_name3.

结果:
escape e_uri_full:%E6%B5%8B%E8%AF%95%E6%96%87%E4%BB%B6.txt
escape e_url_full:%E6%B5%8B%E8%AF%95%E6%96%87%E4%BB%B6.txt
escape_url   小写:%e6%b5%8b%e8%af%95%e6%96%87%e4%bb%b6.txt

二、
lv_name = '+'.
DATA(lv_name1) = escape( val = lv_name format = cl_abap_format=>e_uri_full ).
DATA(lv_name2) = escape( val = lv_name format = cl_abap_format=>e_url_full ).
WRITE:/ 'escape e_uri_full:' && lv_name1.
WRITE:/ 'escape e_url_full:' && lv_name2.
结果:
escape e_uri_full:%2B
escape e_url_full:+

最终使用预定义函数escape解决问题,文件名称正常