LeetCode
Last updated on 10 months ago
LeetCode
索引
快速求出数组元素到某个值的距离——LeetCode 2602. 使数组元素全部相等的最少操作次数
数学相关
二进制小数的表示
设十进制小数 \(num\) 的二进制表示为 \(0.b_1b_2b_3\cdots b_k\) ,考虑将其转为二进制字符串
每次乘 \(2\) 将小数点向右移动一位,变为 \(b_1.b_2b_3\cdots b_k\),将 \(b_1\) 记录下来并减去,至多循环 \(32\) 次。如果 \(num\) 最终变为 \(0\) ,那么便可以直接返回
不难写出如下代码:
1 |
|
优化:
- 任何一个有限位 \(p\) 进制小数均可以表示成最小分数 \(\frac{a}{p^k}\) ,其中 \(a\) 和 \(p^k\) 互质
\(num\) 最多为十进制六位小数,设其表示为 \(\frac{a}{10^6}\) ,设其对应二进制表示为 \(\frac{b}{2^k}\) ,有:
\[ \frac{a}{10^6}=\frac{b}{2^k} \rightarrow \frac{a}{2^65^6}=\frac{b}{2^k} \rightarrow b=\frac{a2^{k-6}}{5^6} \]
由于 \(b\) 与 \(2\) 互质,因此 \(0\le k\le 6\) ,即对于六位十进制小数而言,其对应二进制小数最多只有六位,因此只需要枚举 \(6\) 次即可
完整代码:
1 |
|
位运算
下面给出常用位运算技巧:
我们用一个二进制数来表示一个集合,那么有:
- 将 \(x\)
变为集合:
1 << x
- 判断 \(x\) 是否在集合 \(A\)
中:
((A >> x) & 1) == 1
- 计算两个集合 \(A,B\) 的并集 \(A\cup B\):
A | B
- 计算 \(A\setminus B\),表示从集合
\(A\) 中去掉集合 \(B\) 中的元素:
A & ~B
。例如110 & ~11 = 100
- 得到全集 \(U=\{ 0,1,2,\cdots, n - 1
\}\):
(1 << n) - 1
排列相关
求全局 & 局部倒置对数量
整理一下题意,对于满足 \(nums[i]\gt nums[j],i<j\) 的逆序对称为全局倒置;对于满足 \(nums[i]\gt nums[i+1]\) 的逆序对称为局部倒置
如果全局倒置的数量等于局部倒置的数量,则返回
true
贪心
注意到局部倒置的数量为全局倒置数量的子集,也就是说如果我们统计所有满足「属于全局倒置而不属于局部倒置」的逆序对,只要这个结果为 \(0\) ,就表明全局倒置和局部倒置的数量相等
如果当前值比满足「属于全局倒置而不属于局部倒置」后缀的最小值要大,那么说明必然不符合题意
也就是说,我们需要从 \(n-3\) 开始枚举,而后缀最小值从 \(n-1\) 开始维护,每次用 \(i+1\) 来进行更新
完整代码如下:
1 |
|
时间复杂度:\(O(n)\)
树状数组
对于 \(x\) ,我们需要求出前面所有比其大的数的个数,这恰好可以用树状数组(前缀和)来实现
我们以元素值为下标,数组对应值表示该元素出现的次数,对于 \(x\) 而言,所有比其小的数的个数为 \(\sum_{i=1}^{x-1}s_i\)
完整代码如下:
1 |
|
时间复杂度:\(O(n\log n)\) ,树状数组的插入和查询均为 \(O(\log n)\)
基于排列性质
由于整个数组是一个从 \(0\sim n-1\) 的排列,因此对于每个数组元素,将整个数组排序后都有与其唯一对应的位置(也就是以元素下标)
具体地,对于排列 \([3,4,0,2,1]\) ,有:
\(3\) 应当放在下标为 \(3\) 的位置,\(4\) 应当放在下标为 \(4\) 的位置,\(0\) 应当放在下标为 \(0\) 的位置,\(2\) 应当放在下标为 \(2\) 的位置,\(1\) 应当放在下标为 \(1\) 的位置
回到本题,对于元素 \(nums[i]\) 而言,其应当放在位置 \(i\) ,如果我们期望由 \(nums[i]\) 构成的逆序对满足「属于全局倒置而不属于局部倒置」,这就要求 \(nums[i]\) 距离 \(i\) 不能超过 \(1\),也就是不能超过局部倒置的范围,即:
\[ |nums[i]-i|\le 1 \]
所以我们可以对每个数依次判断它与对应位置的距离,完整代码如下:
1 |
|
数组
这道题可以用最暴力的做法,每次将子数组进行排序,然后考虑子数组是否为等差数列,这里我们直接给出代码,不做过多讨论
1 |
|
这么做的时间复杂度为:\(O(mn\log n)\),其实有 \(O(nm)\) 的做法
对于一个序列,设最大值为 \(maxv\) ,最小值为 \(minv\) ,元素个数为 \(l\),如果从新排列使其能够成为等差序列,其公差必然为:
\[ \frac{maxv-minv}{l-1} \]
如果无法整除,说明该序列无法构成等差数列
更进一步,我们需要确认将数从新排列后是否出现冲突,因此需要确认每个数在等差数列当中的位值,如果出现冲突则说明该序列无法构成等差数列
具体地,对于数 \(x\) 而言,其在等差数列当中的位置为:
\[ idx=\frac{x-minv}{d} \]
因此这一步我们可以开一个哈希表来判断是否出现冲突,如果都没有出现冲突,则说明该子数组重新排列后可以构成等差数列
完整代码如下:
1 |
|
删除部分元素使数组有序
LeetCode 1574. 删除最短的子数组使剩余数组有序
双指针 + 二分
我们需要删除一个子数组使得剩余数组呈非递减状态
首先从左往右遍历,得到最长非递减前缀下标 \(left\) ,此时数组 \([0\cdots left]\) 均为非递减数组
此前从右往左遍历,得到最长非递减后缀下标 \(right\),此时数组 \([right\cdots n-1]\) 均为非递减数组
此时可以我们可以删去 \([0\cdots right-1]\) 或者 \([left+1\cdots n-1]\) ,此时可以保证剩余数组一定有序,即 \(ans=\min(right,n-1-left)\)
此后,我们枚举区间 \([0\cdots left]\) (设下标为 \(l\)),在 \([right\cdots n-1]\) 中找到第一个大于等于的数(设下标为 \(r\)),此时删去区间 \([l+1,r-1]\) 可保证剩余数组一定有序,即 \(ans=\min(ans,r-l-1)\)
注:
lower_bound
可以找到第一个大于等于的数,upper_bound
可以找到第一个大于的数
完整代码如下:
1 |
|
双指针
类似于上面的做法,我们首先找到最长非递减后缀 \(right\),此时 \(ans=right\)
左指针 \(left\) 从左往右遍历,我们需要删除的区间为开区间 \((left,right)\)
对左指针而言,首先需要保证非递减,因此必然需要满足 \(arr[left-1]=arr[left]\)
再者,对于元素 \(arr[left]\) ,我们需要右移右指针 \(right\) ,使得 \(arr[right]\ge arr[left]\)
完整代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
class Solution {
public:
int findLengthOfShortestSubarray(vector<int>& arr)
{
int n = arr.size();
int right = n - 1;
while(right >= 1 && arr[right - 1] <= arr[right]) right--;
if(right == 0) return 0;
int ans = right;//删除[0,right-1]
for(int left = 0; left == 0 || arr[left - 1] <= arr[left]; left ++)
{
while(right <= n - 1 && arr[left] > arr[right]) right++;
ans = min(ans, right - left - 1);
}
return ans;
}
};
1 |
|
快速求出数组元素到某个值的距离
原题链接:LeetCode 2602. 使数组元素全部相等的最少操作次数
前缀和 + 二分
将 \(nums[i]\) 中的元素全部变为 \(q\) ,相当于求 \(nums[i]\) 中每个元素到 \(q\) 的距离
由于 \(nums[i]\) 的顺序与最终结果无关,因此可以先对其排序
此后我们二分,找到第一个大于等于 \(q\) 的数的下标 \(k\) ,此时左边 \(\lt q\),右边 \(\ge q\)
然后我们从面积的角度来考虑,左边的距离和为:\(q\) 对应面积减去元素面积;右边距离和为:元素面积减去 \(q\) 对应面积,即:
\[ \begin{align*} l&=k\times q-s[k]\\ r&=(s[n]-s[k])-(n-k)\times q \end{align*} \]
完整代码如下:
1 |
|
时间复杂度:\(O(n\log n)\)
考虑距离和的增量
前缀和
我们先对所有相同元素的下标进行分组,之后再单独考虑每个组内部的情况
对于某个组 \(q\) ,其每个元素均为下标,我们需要求每个元素到其余元素的距离之和,那么本题与上一题就一样了
完整代码如下:
1 |
|
时间复杂度:\(O(n)\) ,由于数组 \(q\) 本身有序且每次求的 \(v\) 均为数组元素,因此不需要二分
贪心
设数组 \(q\) 长度为 \(n\) ,下标从 \(0\) 开始,\(s_i\) 表示下标 \(i\) 对应元素到其余元素的距离
假设当前已经求出了 \(s_0\) ,我们考虑 \(s_1\) 与 \(s_0\) 之间的关系:
从 \(q_0\) 到 \(q_1\) ,有 \(1\) 个元素增大了 \(q_1-q_0\) ,\(n-1\) 个元素减小了 \(q_1-q_0\) ,即:\(s_1=s_0+(q_1-q_0)-(n-1)(q_1-q_0)\)
更一般地,\(s_i\) 与 \(s_{i-1}\) 之间,有 \(i\) 个元素增大了 \(q_i-q_{i-1}\) ,有 \(n-i\) 个元素减小了 \(q_i-q_{i-1}\),即:
\[ \begin{align*} s_i&=s_{i-1}+i\times (q_i-q_{i-1})-(n-i)\times (q_i-q_{i-1})\\ &=s_{i-1}+(2i-n)\times(q_i-q_{i-1}) \end{align*} \]
在代码实现上,我们先求出 \(s_0\) ,然后不断更新 \(s_i\) 即可
完整代码如下:
1 |
|
数据结构应用题
原题链接:846. 一手顺子
出于便利,我们用 \(m\) 代替 \(groupSize\)
只要 \(hand\) 和 \(m\) 唯一给定,那么划分的方式也就确定了,因此本题实质上是模拟的过程
在这里我们用「哈希表」来对每个数进行频率统计,之后从小到大枚举每个数
设当前枚举数为 \(t\) ,我们考虑以 \(t\) 为左端点的序列
如果序列 \(t,t+1,t+2,\cdots, t+m-1\) 当中的任意一个数均在哈希表中出现过,则将对应数的出现频率减一
这个过程中,只要出现有某个数出现频率变为负数,说明发生冲突,直接返回
false
而对于当前枚举的左端点 \(t\) ,如果其在哈希表中对应值为 \(0\) ,表明当前数已经与前面的数相匹配,直接跳过
由于我们每次都需要取当前的较小值,因此考虑用「小根堆」解决
完整代码如下:
1 |
|
字符串
子串思考的通用思路
如果需要枚举一个字符串的子串,需要知道两个量:结束位置与起始位置
如果需要枚举一对字符串的子串,在长度相同的情况下,需要知道三个量:s
中的结束位置 \(i\) 、t
中的结束位置 \(j\) 、子串长度(起始位置
\(k\))
首先考虑 \(i=j\) 的情况
此时该子串的结束位置是固定的,我们向前枚举,找到上一个不同字符的下标 \(k1\),与上上个不同字符的下标 \(k0\)
此时统计的个数为区间 \((k0,k1]\) 当中的字符数,即 \(k1-k0\)
二者的初值可以直接为 \(-1\)(二者的意义均为:不同字符的位置)
对于 \(i\ne j\) 的情况,我们枚举二者的差值 \(d=i-j\)
由于 \(1\le i\le n,1\le j\le m\) ,因此 \(1-m\le d\le n-1\)
我们始终以 s
为基准,考察 \(d\) 的范围:
若 \(d\gt 0\) ,此时有 \(i\gt j\) ,相当于将
t
右移 \(d\) 个单位,此时s
的起始遍历位置为 \(d\) ,t
的起始遍历位置为 \(0\),将 \(k0,k1\) 初始化为 \(d-1\)若 \(d\lt 0\) ,此时有 \(i\lt j\) ,相当于将
t
左移 \(d\) 个单位,此时s
的起始遍历位置为 \(0\) ,t
的起始遍历位置为 \(d\) ,将 \(k0,k1\) 初始化为 \(-1\)
完整代码如下:
1 |
|
时间复杂度:\(O((n+m)\min(n,m))=O(nm)\)
回文字符串
原题链接:1400. 构造 K 个回文字符串
对于回文字符串有一个结论:对于长度为 \(n\) 的回文字符串,一定可以分解为个数或长度为 \(d,\ d\in[1,n]\) 的回文字符串
我们考虑回文字符串的组成,必然有两种可能:
- 长度为奇数,其中心为一个字符
- 长度为偶数,其中心为两个相等字符
我们随意取一个回文字符串 abcdfdcba
,我们去掉中心字符,得到 abcddcba
和 f
,进一步,我们对 abcddcba
进行拆分,有:abccba
,dd
,f
这个过程可以持续下去,我们可以得到一个结论:
对于一个长度为 \(n\) 的回文字符串,对其拆分必然可以得到个数为 \(1,2,3,\cdots,n\) 的回文字符串同时也可以得到长度为 \(1,2,3,\cdots,n\) 的回文字符串
回到本题,对于字符串 s
,如果我们求出其能表示出的最少回文字符串 \(l\) 和最多回文字符串 \(r\) ,那么只要 \(k\) 处于 \([l,r]\) 内,必然是符合条件
设 s
中有 \(p\)
个字符出现了奇数次,有 \(q\)
个字符出现了偶数次,那么 s
所能构成的回文字符串的个数最小值是多少?
对于出现偶数次的字符,我们可以任意组合,但对于出现奇数次的字符,我们需要保证其必须处于一个回文字符串的中心,因此这最少能表示的字符个数为 \(p\)
特别地,如果如果 \(p==0\) ,表明全部由偶数个字符组成,此时个数为 \(1\) ,因此总体为 \(\max(p,1)\)
完整代码如下:
1 |
|
二叉树
原题链接:1110. 删点成林
我们考虑如果要将一个节点加入答案数组需要满足什么条件:
- 当前点不能有父节点
- 当前点不在
to_delete
中 - 当前点的左右子树均处理完毕
我们根据这三个条件着手设计递归函数
基于前两点,我们需要用 \(u\) 来表示当前递归到的节点,用 \(has\_father\) 来表示当前节点是否有父节点
在返回值部分,我们需要根据当前节点的左孩子与右孩子是否被删除来判断是否需要对当前节点进行更改,因此需要用
bool
作为返回类型
意思是说,如果当前节点的左孩子需要被删除,那么我们需要将当前节点的左孩子置空,这对于右孩子也是一样
基于此设计,在返回时我们需要返回当前节点是否会被删除
在代码实现上,考虑去重可以直接用哈希表
1 |
|