基础算法

Last updated on 2 years ago

基础算法

双指针及其使用条件

双指针使用的条件为两个指针都必须具有单调性,所谓单调性,就是当右指针向右走的时候,左指针不允许出现向左走的情况,具体需要依据题目来确定,但必须要满足这一点才能够用双指针

能够使用双指针

LeetCode 1574. 删除最短的子数组使剩余数组有序


不能使用双指针

原题连接:LeetCode 1590. 使数组和能被 P 整除

求区间和,首先用前缀和处理,将区间和转化为两个数的差,有:

1
2
3
4
int n = nums.size();
vector<int>prefix(n + 1, 0);
for(int i = 1; i <= n; i ++)
prefix[i] = (prefix[i - 1] + nums[i - 1]) % p;

设需要删除的区间为 \([l,r]\) ,此时区间和为 \(prefix[r]-prefix[l-1]\) ,若满足

\[ prefix[n]-(prefix[r]-prefix[l-1]) \equiv 0(\bmod\ p) \]

那么该区间便是局部解

这里不能用双指针的点在于,\(prefix[i]\bmod\ p\) 并不是单调的,也就是说当右指针递增时,我们无法保证左指针一定不会出现递减的情况


关于「单调性」的理解:

在这里我将其理解为「二分性」

回顾二分查找算法:在一个单调递增的数组中,找到某个数 \(x\) 的最小下标 对于一个单调递增的区间而言,它是具有「二分性」的,整个数组可以划分为两个集合——「满足性质 \(p\)」以及「不满足性质 \(p\)」,在这个案例中,「性质 \(p\)」为是否「大于等于 \(x\)

这两个集合没有交集,而二分找的就是两个集合的两个分界点

回到这里,当右指针递增的时候,如果此时左右指针构成的区间能够保证二分性,那么便说明可以使用双指针

对于区间 \([l,r]\) ,我们无法找到某个点 \(idx\) 将区间划分为两个不相交的集合使得左集合内所有元素均满足 \(prefix[n]-(prefix[r]-prefix[l]) \equiv 0(\bmod\ p)\)


这道题正确的做法是用哈希表

由于每次枚举的是右端点,因此为确定值,将上式移项,有:

\[ prefix[l-1]\equiv prefix[r]-prefix[n](\bmod\ p) \]

因此,只需要用哈希表记录最近一次\(prefix[r]-prefix[n](\bmod\ p)\)出现的下标,然后取最小值即可

这道题有两个细节:

  • 哈希表需要预先将 \(0\) 存入,因为前缀和是从 \(0\) 开始的
  • 求前缀和时,需要对 \(p\) 取模,因为会爆 int

完整代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
class Solution {
public:
int minSubarray(vector<int>& nums, int p)
{
int n = nums.size();
vector<int>prefix(n + 1, 0);
for(int i = 1; i <= n; i ++)
prefix[i] = (prefix[i - 1] + nums[i - 1]) % p;
int cnt = 0x3f3f3f3f;
unordered_map<int, int>Hash;
for(int i = 0; i <= n; i ++)//需要将0提前放入哈希表中
{
Hash[prefix[i]] = i;//用于记录prefix[i]在哈希表中最后一次出现得到下标
int left = (prefix[i] - prefix[n] + p) % p;//保证不出现负数
if(Hash.find(left) != Hash.end())
cnt = min(cnt, i - Hash[left]);
}
return cnt == 0x3f3f3f3f || cnt == n ? -1 : cnt;
}
};

如果用 long long ,不对前缀和取模,需要在哈希表插入时取模,因为 \(prefix[r]-prefix[n](\bmod\ p)\) 的值不会超过 \(p\)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
class Solution {
public:
int minSubarray(vector<int>& nums, int p)
{
int n = nums.size();
vector<long long>prefix(n + 1, 0);
for(int i = 1; i <= n; i ++)
prefix[i] = (prefix[i - 1] + nums[i - 1]);
int cnt = 0x3f3f3f3f;
unordered_map<int, int>Hash;
for(int i = 0; i <= n; i ++)//需要将0提前放入哈希表中
{
Hash[prefix[i] % p] = i;//用于记录prefix[i]在哈希表中最后一次出现得到下标
int left = ((prefix[i] - prefix[n]) % p + p) % p;//前面一定要先取一次模,因为前面一定会超出p
if(Hash.find(left) != Hash.end())
cnt = min(cnt, i - Hash[left]);
}
return cnt == 0x3f3f3f3f || cnt == n ? -1 : cnt;
}
};

原题链接:LeetCode 面试题 17.05. 字母与数字

是字母还是数字并不重要,我们将字母设成 \(-1\) ,数字设成 \(1\) 此时原数组便可以转化成一个只含 \(0,1\) 的整数数组

我们需要求最长的子数组保证里面的数字与字母相同,等价于,在整数数组中求一段子数组使得 \(0\)\(1\) 的个数相同,即这段区间和为 \(0\)

考虑用前缀和优化,这时问题转变成求两个数 \(prefix[r],prefinx[l-1]\) 使得 \(prefix[r]=prefix[l-1]\) 并且期望区间最大

子区间并不具有「二分性」,因此不能用双指针,考虑用哈希表

对于当前枚举到的数 \(prefix[i]\) 而言

  • 如果不在哈希表中,那么将其加入哈希表内
  • 如果在哈希表中,则计算一遍区间大小,取最大的区间赋值给 \(l,r\)

完整代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
class Solution {
public:
vector<string> findLongestSubarray(vector<string>& array)
{
int n = array.size();
vector<int>num(n + 1, 0), prefix(n + 1, 0);
for(int i = 0; i < n; i ++)
{
if(isalpha(array[i][0])) num[i] = -1;
else num[i] = 1;
prefix[i + 1] = prefix[i] + num[i];
}
unordered_map<int, int>Hash;
int r = 0, l = 0;
for(int i = 0; i <= n; i++)
{
auto it = Hash.find(prefix[i]);
if(it == Hash.end())//第一次遇到,则对哈希表赋值
Hash[prefix[i]] = i;
else if(i - it->second > r - l)//第二次遇到,对区间赋值
r = i, l = it->second;
}
return {array.begin() + l, array.begin() + r};
}
};

哈希表记录已出现元素的几种模板

设当前元素为 \(x\)

  • 利用哈希表查找之前出现的不同于 \(x\) 的元素(设为 \(y\)

先将元素放入哈希表中,随后再考虑 \(y\) 是否在哈希表中出现过,如果在哈希表中则更新答案

典型例题:

LeetCode 1590. 使数组和能被 P 整除

1
2
3
4
5
6
7
8
unordered_map<int, int>Hash;
for(int i = 0; i <= n; i ++)
{
Hash[prefix[i] % p] = i;
int left = ((prefix[i] - prefix[n]) % p + p) % p;
if(Hash.find(left) != Hash.end())
cnt = min(cnt, i - Hash[left]);
}

  • 利用哈希表查找 \(x\)

先考虑 \(x\) 是否在哈希表中,如果不在将其放入,在的话则更新答案

典型例题:

LeetCode 面试题 17.05. 字母与数字

1
2
3
4
5
6
7
8
9
10
unordered_map<int, int>Hash;
int r = 0, l = 0;
for(int i = 0; i <= n; i++)
{
auto it = Hash.find(prefix[i]);
if(it == Hash.end())
Hash[prefix[i]] = i;
else if(i - it->second > r - l)
r = i, l = it->second;
}

LeetCode 6317. 统计美丽子数组数目

这题思路跟 LeetCode 面试题 17.05. 字母与数字 一样的,在此不过多说明

都是先考虑当前值是否在哈希表中,然后再将这个值插入哈希表中

完整代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
class Solution {
public:
long long beautifulSubarrays(vector<int>& nums)
{
long long ans = 0;
long long x = 0;
unordered_map<int, int>hash{{0,1}};
for(int i : nums)
{
x ^= i;//求前缀异或和
ans += hash[x]++;//如果不在哈希表中,则为0,随后再将其插入哈希表中
}
return ans;
}
};

何时用 DFS 与 BFS

如果从题目中我们分析出,从一个状态可以单向转移到多个其他的状态,并且在数据量不大的情况下,我们可以考虑暴力枚举

暴力枚举分为 \(\rm BFS\)\(\rm DFS\) ,具体是使用需要依据题目来

需要注意的是,\(\rm BFS\) 是可以求最短路径的(在路径权重均相同的情况下)

典型例题:

LeetCode 797. 所有可能的路径

这是一道非常简单的题目,每一个节点都可以走到其他的节点,即满足「从一个状态可以单向转移到其他状态」,因此考虑用暴力枚举

注意到这道题是非常经典的回溯问题,因此考虑 \(\rm DFS\)

完整代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
class Solution {
public:

vector<vector<int>>ans;
vector<int>path;

void dfs(vector<vector<int>>& graph, int pos, int n)
{
if(pos == n)
{
ans.push_back(path);
return;
}
for(int x : graph[pos])
{
path.push_back(x);
dfs(graph, x, n);
path.pop_back();
}
}

vector<vector<int>> allPathsSourceTarget(vector<vector<int>>& graph)
{
path.push_back(0);
dfs(graph, 0, graph.size() - 1);
return ans;
}
};

LeetCode 1625. 执行操作后字典序最小的字符串

我们首先去掉执行「任意」多次这个条件,因为这个条件会干扰我们分析问题

考虑对字符串执行一次操作,由于操作只有两个,因此一个字符串可以生成两个不同的字符串,即满足「从一个状态可以单向转移到其他多个状态」,可以考虑暴力枚举

思考到这里,我们发现,如果我们对初始字符串执行任意多次操作,本质上是生成了一个有向图,即对于任意一个可达的状态,我们都可以通过多次两种操作的组合生成

我们需要求的是在整个图中,字典序最小的字符串,直接遍历整个图即可,这里我们选择 \(\rm BFS\)

每次从队头取出节点并将其弹出,然后求一次最小值,我们遍历该节点的所有出边(也就是两种可以生成的字符串)

为了避免遍历到重复节点,我们需要用一个哈希表来进行去重,如果当前节点没有在哈希表中出现过,我们将当前节点加入队列中

完整代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
class Solution {
public:

/*
每个字符串都可以都可以通过这两个操作生成另外两个字符串
将每个字符串抽象成一个点,每个点都会有两条出边,此时我们得到了一个有向图
用BFS遍历所有点,找到值最小的即可
*/

string findLexSmallestString(string s, int a, int b)
{
int n = s.length();
queue<string>q;
unordered_set<string>st;
q.push(s);
st.insert(s);
string ans = s;
while(q.size())
{
string t = q.front();
q.pop();
ans = min(ans, t);
string s1 = t.substr(n - b) + t.substr(0, n - b);
string s2 = t;
for(int i = 1; i < n; i += 2)
s2[i] = (s2[i] - '0' + a) % 10 + '0';
for(string x : {s1, s2})
{
if(!st.count(x))
{
st.insert(x);
q.push(x);
}
}
}
return ans;
}
};

其他例题:

AcWing 187. 导弹防御系统

二分边界条件的特殊判断

我们首先给出二分的模板:

二分的使用首先需要保证整个区间具有「二分性」,即区间可以恰好划分成两个没有交集的区间,使得前者满足性质 \(p\) 而后者不满足性质 \(p\)

而二分就是为了去找那两个端点

具体地,对于区间 \([1\cdots n]\) ,如果 \([1\cdots l]\) 满足性质 \(p\)\([l+1\cdots n]\) 不满足性质 \(p\) ,那么二分可以寻找分界点 \(l\)\(l+1\) ,分别对应两个不同的模板

寻找左端点的模板:

1
2
3
4
5
6
7
8
9
int l = 1, r = n;
while(l < r)
{
int mid = l + r + 1;//l开头的话需要加1
if(check(mid)) l = mid;
else r = mid - 1;
}
if(check(l))//一定要去判断最后的结果是否满足条件
...

寻找右端点的模板:

1
2
3
4
5
6
7
8
9
int l = 1, r = n;
while(l < r)
{
int mid = l + r >> 1;//r开头不需要加1
if(check(mid)) r = mid;
else l = mid + 1;
}
if(check(l))
...

需要注意的是,二分的最终出口一定是 \(l=r\),因此 \(l\)\(r\) 在此模板当中是等价的

有一些题目需要我们判断一下边界的情况,比如如果所有元素都满足性质 \(p\)或者都不满足性质 \(p\) (对应的出口最终为 \(l=1\) 或者 \(l=n\)),这时我们需要额外考虑

缺失的数(重点)

原题链接:LeetCode 1539. 第 k 个缺失的正整数

\(i\)\(1\) 开始,对于元素 \(a_i\) 而言,\(1\sim i\)没有出现的元素个数\(a_i-i\),具体情况如下表:

i的取值 1 2 3 4 5 6
a[i] 2 5 7 9 11 15
a[i]-i 1 3 4 5 6 9
缺失数 1 1,3,4 1,3,4,6 1,3,4,6,8 1,3,4,6,8,10 1,3,4,6,8,10,12,13,14

\(p_i=a_i-i\) ,我们需要找到某个 \(i\) ,使得 \(p_i\lt k\le p_i+1\)

也就是,我需要找出严格小于 \(k\) 的数当中最大的那个

我们可以将性质 \(p\) 定义为:严格小于 \(k\),随后二分即可,最终答案为:$ k-p_i+a_i$

对于边界的判断:

如果数组 \(p_i\) 所有元素均满足性质 \(p\) ,也就是一定存在某个 \(p_i\) 使得 \(p_i\lt k\) 成立,此种情况合法

如果数组 \(p_i\) 所有元素均不满足性质 \(p\) ,说明不存在某个 \(p_i\) 使得 \(p_i\lt k\) 成立,此时我们需要直接返回 \(k\)

完整代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
class Solution {
public:
int findKthPositive(vector<int>& arr, int k)
{
int l = 1, r = arr.size();
while(l < r)
{
int mid = l + r + 1 >> 1;
if(arr[mid - 1] - mid < k) l = mid;
else r = mid - 1;
}
if(arr[l - 1] - l < k) return l + k;
else return k;
}
};

前缀和的两种写法

前缀和一定是相比于原数组右移一位的

如果数组 \(a[i]\) 的下标为 \(0\sim n-1\)

那么 \(a[i]\) 的前缀和数组 \(s[i]\) 的下标为 \(1\sim n\)(下标为 \(0\) 的地方对应的值为 \(0\)

\(s[i]\) 的前缀和数组 \(ss[i]\) 的下标为 \(2\sim n+1\) (下标为 \(0,1\) 的地方均为 \(0\)

往后以此类推

以元素序号为基准

对于数组 \(a_1,a_2,a_3,\cdots,a_n\) ,我们定义数组 \(s[i]\) 表示数组 \(a[i]\) 的前缀和,有:

\[ \begin{align*} s[i]=\left\{\begin{array}{l} a[0], &i=0\\ \sum_{j=1}^{i}a[j], &i\ge 1 \end{array} \right. \end{align*} \]

因此对于区间 \([l,r]\)\(l,r\) 均从 \(1\) 开始),其和为 \(s[r]-s[l-1]\),即:

\[ \sum_{i=l}^{r}a[i]=s[r]-s[l-1] \]


以元素下标为基准

对于数组 \(a_0,a_1,a_2,\cdots,a_{n-1}\) ,我们定义数组 \(s[i]\) 为其前缀和,有:

\[ \begin{align*} s[i]=\left\{\begin{array}{l} a[0],&i=0\\ \sum_{j=0}^{i-1}a[j],&i\ge 1 \end{array}\right. \end{align*} \]

因此对于区间 \([l,r]\)\(l,r\) 均从 \(0\) 开始),其和为 \(s[r+1]-s[l]\),即:

\[ \sum_{i=l}^{r+1}a[i]=s[r+1]-s[l] \]


归纳:

  • 两种前缀和的构造方面,完全是等价的,不同的点在于区间的意义上

  • 如果区间表示的是序号(从 \(1\) 开始),那么选第一个

  • 如果区间表示的是下标(从 \(0\) 开始),那么选第二个

单调栈 + 前缀和的前缀和

LeetCode 2281. 巫师的总力量和

看到「子数组」和「最弱」,其实应该马上想到有可能会用到「单调栈」了

对于某个元素 \(w[i]\) 而言,我们需要找到左边第一个严格小于的元素 \(w[L]\) 和右边严格小于的元素 \(w[R]\) ,此时子数组 \([L+1,R-1]\) 就是我们待枚举区间

当然这么定义会有一个问题是,有可能会枚举到重复的子数组,例如:

\([1,3,1,2]\) ,对于 \(w[0]\) 而言,\(L=-1,R=n\);对于 \(w[2]\) 而言,\(L=-1,R=n\),因此区间 \([-1,n]\) 被我们枚举了两次

此时我们需要修改定义,我们找到左边第一个严格小于的元素 \(w[L]\) 和右边第一个大于等于的元素 \(w[R]\) ,此时便可保证不重不漏

对于待枚举区间 \([L,R]\)(下标从 \(0\) 开始)而言,设 \(L\le l\le i\le r\le R\) ,其中 \(l,r\) 均为变量,此时有:

\[ \sum_{i=l}^{r}a[i]=s[r+1]-s[l] \]

由于 \(l,r\) 均为变量,有:

\[ \begin{align*} \sum_{r=i}^{R}\sum_{l=L}^{i}s[r+1]-s[l]&=\sum_{r=i+1}^{R+1}\sum_{l=L}^{i}(s[r]-s[l])\\ &=\left( (i-L+1)\sum_{r=i+1}^{R+1}s[r] \right)-\left( (R-i+1)\sum_{l=L}^{i}s[l] \right)\\ &=(i-L+1)(ss[R+2]-ss[i+1])-(R-i+1)(ss[i+1]-ss[L]) \end{align*} \]

如果待枚举区间 \([L,R]\)(下标从 \(1\) 开始),则:

\[ \begin{align*} \sum_{r=i}^{R}\sum_{l=L}^{i}s[r]-s[l-1]&=\sum_{r=i}^{R}\sum_{l=L-1}^{i-1}s[r]-s[l]\\ &=\left( (i-L+1)\sum_{r=i}^{R}s[r] \right)-\left( (R-i+1)\sum_{l=L-1}^{i-1}s[l] \right)\\ &=(i-L+1)(ss[R]-ss[i-1])-(R-i+1)(ss[i-1]-ss[L-2]) \end{align*} \]

子数组下标从 \(0\) 开始:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
class Solution {
public:
const int mod = 1e9 + 7;
int totalStrength(vector<int>& strength)
{
int n = strength.size();
vector<int> left(n, -1);//左侧严格小于i的元素下标
vector<int> right(n, n);//右侧小于等于i的元素下标
vector<int> st;
for(int i = 0; i < n; i ++)
{
while(!st.empty() && strength[st.back()] >= strength[i])
{
right[st.back()] = i;//对st.back而言刚好满足,当前元素小于等于它
st.pop_back();
}
left[i] = st.empty() ? -1 : st.back();
st.push_back(i);
}
vector<long long> ss(n + 2, 0);
long long s = 0;
for(int i = 1; i <= n; i ++)
{
s += strength[i - 1];
ss[i + 1] = (ss[i] + s) % mod;
}
int cnt = 0;
for(int i = 0; i < n; i ++)
{
int L = left[i] + 1, R = right[i] - 1;//这里的L和R均为下标,并不是元素序号
long long tot = ((i - L + 1) * (ss[R + 2] - ss[i + 1]) - (R - i + 1) * (ss[i + 1] - ss[L])) % mod;
cnt = (cnt + tot * strength[i]) % mod;
}
return (cnt + mod) % mod;
}
};

子数组下标从 \(1\) 开始:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
class Solution {
public:

const int mod = 1e9 + 7;

int totalStrength(vector<int>& strength)
{
int n = strength.size();
vector<int> left(n, 1);//左侧严格小于i的元素下标
vector<int> right(n, n + 2);//右侧小于等于i的元素下标
vector<int> st;
for(int i = 1; i <= n; i ++)
{
while(!st.empty() && strength[st.back() - 1] >= strength[i - 1])
{
right[st.back() - 1] = i + 1;//对st.back而言刚好满足,当前元素小于等于它
st.pop_back();
}
left[i - 1] = st.empty() ? 1 : st.back() + 1;
st.push_back(i);
}
vector<long long> ss(n + 2, 0);
long long s = 0;
for(int i = 1; i <= n; i ++)
{
s += strength[i - 1];
ss[i + 1] = (ss[i] + s) % mod;
}
int cnt = 0;
for(int i = 2; i <= n + 1; i ++)
{
int L = left[i - 2] + 1, R = right[i - 2] - 1;//这里的L和R均为下标,并不是元素序号
long long tot = ((i - L + 1) * (ss[R] - ss[i - 1]) - (R - i + 1) * (ss[i - 1] - ss[L - 2])) % mod;
cnt = (cnt + tot * strength[i - 2]) % mod;
}
return (cnt + mod) % mod;
}
};

求奇偶前缀和

原题链接:LeetCode 1664. 生成平衡数组的方案数

这道题不难,就是记录以下求奇偶前缀和的方法

由于题目要求奇数下标和与偶数下标和相等,那么在某个位置删除一个元素,如果当前是累加偶数的话,后面就需要累加奇数;如果当前是累加奇数的话,后面需要累加偶数

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
class Solution {
public:
int waysToMakeFair(vector<int>& nums)
{
int n = nums.size();
vector<int>odd(n + 1, 0), even(n + 1, 0);
//奇偶前缀和写法
for(int i = 1; i <= n; i ++)
{
even[i] = even[i - 1] + (i % 2 ? nums[i - 1] : 0);
odd[i] = odd[i - 1] + (i % 2 ? 0 : nums[i - 1]);
}
int cnt = 0;
for(int i = 0; i < n; i ++)
{
int l = even[i] + (odd[n] - odd[i + 1]);
int r = odd[i] + (even[n] - even[i + 1]);
if(l == r) cnt++;
}
return cnt;
}
};

基础算法
https://nishikichisato.github.io/2023/04/15/Algorithm_Archiv/基础算法/
Author
Nishiki Chisato
Posted on
April 15, 2023
Updated on
April 22, 2023
Licensed under