[828. 统计子串中的唯一字符] (Hard)

发布时间 2023-07-27 10:40:56作者: zwyyy456

问题描述

828. 统计子串中的唯一字符 (Hard)

我们定义了一个函数 countUniqueChars(s) 来统计字符串 s 中的唯一字符,并返回唯一字符的个数。

例如: s = "LEETCODE" ,则其中 "L", "T", "C", "O", "D" 都是唯一字符,因为它们只出现一次 ,所以 countUniqueChars(s) = 5

本题将会给你一个字符串 s ,我们需要返回 countUniqueChars(t) 的总和,其中 ts 的子字符串。 输入用例保证返回值为 32 位整数。

注意,某些子字符串可能是重复的,但你统计时也必须算上这些重复的子字符串(也就是说,你必须统计 s 的 所有子字符串中的唯一字符)。

示例 1:

输入: s = "ABC"
输出: 10
解释: 所有可能的子串为:"A","B","C","AB","BC" 和 "ABC"。
     其中,每一个子串都由独特字符构成。
     所以其长度总和为:1 + 1 + 1 + 2 + 2 + 3 = 10

示例 2:

输入: s = "ABA"
输出: 8
解释: 除了 countUniqueChars("ABA") = 1 之外,其余与示例 1 相同。

示例 3:

输入:s = "LEETCODE"
输出:92

提示:

  • 1 <= s.length <= 10^5
  • s 只包含大写英文字符

解题思路

动态规划

这题很容易想到可以用动态规划来解决。我们令 $dp[i]$ 表示以 $s[i]$ 结尾的子串 $t$ 的 countUniqueChar(t) 值之和。下一步就是寻找递推关系:

假设当前 $s[i]$ 对应的字符是 $c$,那么对以 $s[i - 1]$ 结尾的子串来说,如果子串不包含 $c$,那么以 $s[i]$ 结尾,其 countUniqueChar 的值相当于对应以 $s[i - 1]$ 结尾的子串(即去掉 $c$)值 $+1$,假设字串包含一个 $c$,那么以 $s[i]$ 结尾,其 countUniqueChar 的值相当于以 $s[i - 1]$ 结尾的字串值 $-1$,假设包含两个 $c$,那么以 $s[i]$ 结尾的子串和对应以 $s[i - 1]$ 结尾的字串的 countUniqueChar 的值相等。

我们维护一个 vector<pair<int, int>> left_sameleft_same[i].second 表示与 $s[i]$ 相等的字符的小于 $i$ 的最大坐标,left_same[i].first 表示次大坐标,注意 pair 需要被初始化为 $\lbrace -1, -1\rbrace$。

贡献值法

即求对每个 s[i],有多少个子串在统计唯一字符时,会将 s[i] 统计进去。

代码

动态规划

class Solution {
  public:
    int uniqueLetterString(string s) {
        // 维护每个字符左侧相同字符的最大坐标
        int n = s.size();
        vector<int> arr(26, -1);
        vector<pair<int, int>> left_same(n, {-1, -1});
        for (int i = 0; i < n; ++i) {
            if (arr[s[i] - 'A'] != -1) {
                left_same[i].first = left_same[arr[s[i] - 'A']].second;
                left_same[i].second = arr[s[i] - 'A'];
            }
            arr[s[i] - 'A'] = i;
        }
        vector<int> dp(n);
        dp[0] = 1;
        int sum = 1;
        for (int i = 1; i < n; ++i) {
            dp[i] = dp[i - 1] + i - left_same[i].second - (left_same[i].second - left_same[i].first);
            sum += dp[i];
        }
        return sum;
    }
};

贡献值法

class Solution {
  public:
    int uniqueLetterString(string s) {
        vector<vector<int>> same(26);
        int n = s.size();
        for (int i = 0; i < n; ++i) {
            int idx = s[i] - 'A';
            same[idx].push_back(i);
        }
        int res = 0;
        for (int i = 0; i < 26; ++i) {
            for (int j = 0; j < same[i].size(); ++j) {
                int left = 0, right = 0;
                if (j == 0) {
                    left = same[i][j] + 1;
                } else {
                    left = same[i][j] - same[i][j - 1];
                }
                if (j == same[i].size() - 1) {
                    right = n - same[i][j];
                } else {
                    right = same[i][j + 1] - same[i][j];
                }
                res += left * right;
            }
        }
        return res;
    }
};