power query索引列、重复列、拆分和提取

发布时间 2023-12-11 21:41:38作者: 山雨山

power query索引列、重复列、拆分和提取

一、索引列

1、 进入PQ编辑器
2、添加索引列
添加列——索引列——可自定义索引列

 二、重复列

功能:数据清洗时想保证数据的完整性,但又需要对某些列进行拆分、提取等操作时,一般先重复想处理的列
1、添加列——选中要重复的列——点击‘重复列’

 三、拆分列

 功能:数据清洗中需要一列数据中的某个特定部分时,常采用拆分列。

1、 按分隔符拆分
转换——拆分列——按分隔符拆分(可按分隔符位置分裂)—确定

2、按字符数拆分

转换——拆分列——按字符数拆分(可选拆分位置和次数)—确定

 3、按位置拆分

转换——拆分列——按字符数拆分—在对话框里编辑拆分位置索引(“0英文逗号2”即拆分从0号位置开始到2之前的字符)—确定

注意:字符串中字符的位置编号从0开始

 四、提取

功能:与拆分列类似,都用于提取出一列数据中存储的特定信息

1、按长度:(提取出的是文字的长度)

转换——提取——按“长度”(按字符长度,英文一个字符,汉字一个字符)
注意:字符长度与字符位置(从0开始编码)不同,这里的字符长度指的是字符的个数(从1开始);

2、按首字符:
选中要提取的列——转换——按“首字符”——对话框中填写要提取几个字符长度(从首字符开始数)——确定

3、按结尾字符:
选中要提取的列——转换——按“尾字符”——对话框中填写要提取几个字符(字符开始数)——确定

4、按范围
选中要提取的列——转换——按“范围“——对话框中填写”起始索引“(此处为字符位置,从0编码)和”字符数“——确定
 
5、按分隔符
分隔符可以自自定义
选中要提取的列——转换——选择提取哪种分隔符形式(分隔符前、分隔符后、分隔符之间)——对话框中定义分隔符是什么(汉字、字母、数字、符号等)——确定。