PHP函数封装分分钟帮你实现数据脱敏处理, 支持手机、邮箱、身份证号 中文字符串!

发布时间 2023-11-11 15:29:03作者: 极客小俊

? 个人主页 极客小俊
✍? 作者简介:web开发者、设计师、技术分享博主
? 希望大家多多支持一下, 我们一起进步!?
? 如果文章对你有帮助的话,欢迎评论 ?点赞?? 收藏 ?加关注

什么是数据脱敏?

很多人做过开发,但不一定知道这个词汇数据脱敏

那么数据脱敏其实就是把重要的一些数据信息进行隐藏,

在我们开发指定的脱敏规则之下对敏感数据进行处理、编辑、修改的一种方式,防止这些重要数据直接暴露在不安全的环境下, 这就叫数据脱敏

总的来说数据脱敏的意思就是让敏感的数据通过一种脱胎换骨的手法把它隐藏起来,简单的说就是把敏感数据保护起来!

开发中哪些数据和应用场景需要做数据脱敏

我们平常开发中其实有很多简单的业务也会涉及到数据脱敏这些信息就是比较敏感的信息,必然需要处理才行!

我们来看看以下的这些应用场景!

例如:用户个人信息 我们在处理用户个人信息时,例如姓名、地址、电话号码等,为了保护用户的隐私,需要对这些数据进行脱敏处理,如将电话号码替换为部分号码 或者把手机号码的中间重要的四位数字进行隐藏。

一些金融信息 例如银行账号、信用卡号等,为了防止数据泄露欺诈行为,需要对这些数据进行脱敏处理,如将账号部分数字替换为*对吧!

另外就是一些医疗信息,例如病历、诊断结果、药品处方等,为了保护患者的隐私和安全,需要对这些数据进行脱敏处理,比如:患者姓名、诊断结果等敏感信息进行脱敏。

企业敏感数据也可能存在一些敏感数据,比如: 公司财务报告、产品营销策略文档等,为了防止数据泄露给未授权人员,需要对这些数据进行脱敏处理。

还有数据传输也存在这个情况, 例如在数据库或日志文件中存储用户密码、在互联网传输敏感信息时,为了保护数据的安全性,需要对这些数据进行脱敏处理,如将密码哈希存储、对传输的数据进行加密等。

举个简单的栗子

大家都知道自己账户的银行卡吧, 加入你要查看银行卡的时候,只会显示银行卡的最后4位

如图

这就是数据脱敏后的效果

假如你要查看银行卡的全部卡号,那么你就要通过本人来进行人脸识别,手机短信验证,通过以后才能显示全部银行卡来进行查看!

数据脱敏的简单过程

简单的说也就是把数据中敏感的部分变成密文的手法!

简单的数据脱敏流程大致如下:

首先你要确定哪些数据属于敏感数据, 然后根据实际情况选择合适的脱敏方式,比如: 加密、替换、删除等都可以,用这些方式来对对敏感数据进行脱敏处理 从而确保数据的安全性可用性

如图

然后再根据脱敏数据的规范制定一系列访问权限的逻辑规则

举个栗子

比如用户身份验证或者登录之后,确定用户在某个权限的情况下,对于敏感数据那么就按照用户权限来进行划分访问和查看!

如图

PHP实现数据脱敏的简单方法

假设有一个用户表,其中包含用户的姓名、电话号码电子邮件地址

数据如下

// 用户表数据
$users = [
    ['name' => '张三', 'phone' => '13812345678', 'email' => 'zhangsan@example.com'],
    ['name' => '李四', 'phone' => '13987654321', 'email' => 'lisi@example.com'],
];

为了保护用户的隐私,需要对电话号码电子邮件地址进行脱敏处理!

那么我们可以针对这个业务逻辑封装一个简单函数

代码如下

/**
 * @param $data
 * @return mixed
 */
function desensitizeData($data){
    $sensitiveData = ['phone', 'email'];
    foreach ($sensitiveData as $key) {
        if (isset($data[$key])) {
            $data[$key] = str_repeat('*', strlen($data[$key]));
        }
    }
    return $data;
}

// 对用户表进行循环脱敏处理
foreach ($users as &$user) {
    $user = desensitizeData($user);
}
unset($user);

// 输出脱敏后的用户表数据
print_r($users);

在这个案例当中我们定义了一个desensitizeData函数,它接受一个数组作为参数来检查数组中是否存在需要脱敏的敏感数据字段,并将其替换为相同长度的*字符!

然后,我们遍历用户表中的每个用户,对其中的敏感数据进行脱敏处理,最后输出脱敏后的用户表数据。

这样,用户的电话号码电子邮件地址就被成功地脱敏隐藏了。

结果如下

当然你也可以根据具体需求来修改代码逻辑从而脱敏数据

比如:我们现在需要把保留手机号码前三位后四位,那么我们的代码其实只需要加一个简单的函数就可以了

代码如下

/**
 * @param $phone
 * @return string
 */
function desensitizePhone($phone) {
    return substr($phone, 0, 3) . '****' . substr($phone, 7);
}

/**
 * @param $data
 * @return mixed
 */
function desensitizeData($data){
    $sensitiveData = ['phone', 'email'];
    foreach ($sensitiveData as $key) {
        if (isset($data[$key]) && $key=='phone') {
            $data[$key]=desensitizePhone($data[$key]);
        }else{
            $data[$key] = str_repeat('*', strlen($data[$key]));
        }
    }
    return $data;
}

// 对用户表进行循环脱敏处理
foreach ($users as &$user) {
    $user = desensitizeData($user);
}
unset($user);

// 输出脱敏后的用户表数据
print_r($users);

效果如下

为了更好的实现数据脱敏的需求,我们可以优化一下我们的封装函数

让这个函数可以兼容 手机号、银行卡、身份证、中文字符串的脱敏操作,并且可以自由指定脱敏字符!

代码如下

/**
 * 描述: 手机号,银行卡号,身份证等 中文字符串脱敏处理函数
 * @param $string 需要脱敏值
 * @param int $start 开始
 * @param int $length 结束 隐藏敏感数据的个数
 * @param string $re 脱敏替代符号
 * @return bool|string
 * 示例:
 * _DataDesensitization('数据字符串', 开始位置, 脱敏个数);
 *
 */


function _DataDesensitization($string, $start = 0, $length = 0, $mark = '*'){
    //如果传递的字符串数据为空
    if (empty($string)) {
        return false;
    }

    //定义个空数组
    $container = array();   

    //获取字符串的长度
    $mb_strlen = mb_strlen($string);

    //循环, 把传递进来的字符串变为数组
    while ($mb_strlen) {
        $container[] = mb_substr($string, 0, 1, 'utf8'); //每次循环把字符串最前面的第一个放入数组
        $string = mb_substr($string, 1, $mb_strlen, 'utf8'); //每次循环重新赋值字符串本身
        $mb_strlen = mb_strlen($string); //每一次循环 重新计算字符串的长度,用于循环条件的递减
    }

    //统计一下,转载数组中的元素个数
    $strlen = count($container);
    //求开始下标 例如: 6 - 3  =  3 求出从数组的哪一位开始进行处理
    $begin = $start >= 0 ? $start : ($strlen - abs($start));
    //结束值 也就是数组中的最后一个值对应的下标
    $end = $last = $strlen - 1;  //5

    //$length 也就是要处理敏感数据的个数
    if ($length > 0) {
        $end = $begin + $length - 1;
    } elseif ($length < 0) {
        $end = $end - abs($length); // 5 - 1 = 4
    }

    //用字符串,隐藏对应的数据
    for ($i = $begin; $i <= $end; $i++) {
        $container[$i] = $mark;
    }

    //把不符合逻辑的条件过滤掉, 这几个条件也就是限定我们传递的$start和$length参数是否合法
    // 1.开始下标大于等于结尾下标
    // 2.开始下标大于等于数组中的最后一个元素所对应的下标值
    // 3.结尾值大于了数组中的最后一个元素所对应的下标值
    if ($begin >= $end || $begin >= $last || $end > $last) {
        //        echo '$begin='.$begin."\n";
        //        echo '$end='.$end."\n";
        //        echo '$last='.$last."\n";
        return false;
    }

    //合并数组,返回字符串结果
    return implode('', $container);

}

然后我们来试试看数据脱敏

代码如下

// 用户表数据
$users = [
    ['name' => '张晓明', 'phone' => '13812345678', 'email' => 'zhangsan@example.com'],
    ['name' => '李大嘴', 'phone' => '13987654321', 'email' => 'lisi@example.com'],
];


// 对用户表进行循环脱敏处理
foreach ($users as &$user) {
    //$user = dataDesensitization($user);
    foreach ($user as $key=>$value){
        if($key=='name'){
            $user[$key]=_DataDesensitization($value,1,2,'*');
        }else if($key=='phone'){
            $user[$key]=_DataDesensitization($value,3,4,'*');
        }
    }
}
unset($user);

// 输出脱敏后的用户表数据
print_r($users);

结果如下

小结

数据脱敏是项目中很常见的一种数据保护方式,我们以后也会经常用到这个小技巧!

关于数据脱敏还有很多,不仅仅是这些,有时间在给大家深入分享数据脱敏的更多知识!

"?点赞" "✍️评论" "?收藏"

大家的支持就是我坚持下去的动力!

如果以上内容有任何错误或者不准确的地方,???欢迎在下面 ? 留个言指出、或者你有更好的想法,????欢迎一起交流学习❤️❤️❤️❤️❤️


关注 极客小俊 微信公众号 不定期更新免费技术干货



VX技术交流