【LeetCode摩尔投票】有趣的简单题:数组中出现次数超过一半的数字

发布时间 2023-06-24 20:44:35作者: dayceng

数组中出现次数超过一半的数字

https://leetcode.cn/problems/shu-zu-zhong-chu-xian-ci-shu-chao-guo-yi-ban-de-shu-zi-lcof/

数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。

你可以假设数组是非空的,并且给定的数组总是存在多数元素。

示例 1:

输入: [1, 2, 3, 2, 2, 2, 5, 4, 2]
输出: 2

限制:

1 <= 数组长度 <= 50000

初见思路:哈希表+排序

我的初见思路是用hash表统计个元素出现次数,然后排序,最后看排序后是否有元素的出现次数大于数组的长度的一半

有就返回该值实现代码如下:

class Solution {
public:
    class cmp{
        public:
        bool operator()(pair<int, int>& a, pair<int, int>& b){
            return a.second > b.second;
        }
    };
    int majorityElement(vector<int>& nums) {
        unordered_map<int, int> hash4Count;
        for(int num : nums) hash4Count[num]++;

        vector<pair<int, int>> vec4sort(hash4Count.begin(), hash4Count.end());

        sort(vec4sort.begin(), vec4sort.end(), cmp());

        int numLen = nums.size() / 2;
        if(vec4sort[0].second > numLen) return vec4sort[0].first;
        else return -1;
    }
};

该代码可以通过题目给的用例

但是,在一些特殊情况下,上述代码会有错误

例如,在测试用例[1,2,3,3,3,2,3,4,2]中,上述代码运行错误,原因是正是使用了哈希表和排序

测试用例[1,2,3,3,3,2,3,4,2]中,数字3出现的次数超过了数组长度的一半,因此应该返回3,但是由于哈希表对键值对的遍历顺序不确定,因此在将哈希表中的数据按照出现次数排序时,可能会出现3排在2的前面,从而导致算法返回错误的结果。

由于上述原因,使用哈希表的思路修改多次都会在某些情况下发生错误(尝试的修改包括:直接修改哈希表和排序的部分,遍历哈希表中的键值对,找到出现次数最多的那个数字,如果它的出现次数超过了数组长度的一半,则返回该数字,否则返回-1。仍然错误)

因此,应该换个思路

思路2:排序与众数

还是拿刚刚的用例[1,2,3,3,3,2,3,4,2]

对其进行排序可以得到[1,2,2,2,3,3,3,3,4]

我们发现"3"正好位于数组中间位置,这不是巧合,因为题目要求的数,该数的出现次数要大于数组长度的一半

在此规则下,数组排序之后,中间位置就会是我们要找的数,这个数也就是所谓的"众数"

class Solution {
public:
    int majorityElement(vector<int>& nums) {
        sort(nums.begin(), nums.end());
        return nums[nums.size()/2];
    }
};

这次ac了,代码还超级简单。。。

这种算法的时间复杂度为 O(nlogn),其中 n 是数组大小。

思路3:摩尔投票

回到之前的思路,如果要选一种代替哈希表+排序的思路,那么最正统的应该是Boyer-Moore算法(摩尔投票)

假设当前数字num是众数,初始时将计数器count4Vote赋为1

随后遍历数组,如果元素与num相同,则将计数器加1,否则将计数器减1。

当计数器变为0时,说明之前遍历过的所有数字中,num出现的次数不足一半,因此可以将num更新为当前遍历的数字,并将计数器重新设为1。最终留下来的num即为所求的答案。

图解见

class Solution {
public:
    int majorityElement(vector<int>& nums) {
        int count4Vote = 1;
        int num = nums[0];
        for(int i = 1; i < nums.size(); i++){
            if(nums[i] == num) count4Vote++;
            else{
                count4Vote--;
                if(count4Vote == 0){
                    num = nums[i];
                    count4Vote = 1;
                }
            }
        }
        return num;
    }
};

这种方法的性能要好于排序后取中间值

时间和空间复杂度为 O(n)和 O(1)