查找元素-二分查找
基本思路
如果数组是无序的,要找到某个元素只能老老实实地遍历这个数组了:)
但如果数组有序,用二分法锁定区间,可以做到O(log n)的查找。
#include<iostream>
#include<vector>
using namespace std;
int search(vector<int>& nums, int target) {
int left = 0;
int right = nums.size() - 1; // 定义target在左闭右闭的区间里,[left, right]
while (left <= right) { // 当left==right,区间[left, right]依然有效,所以用 <=
int middle = left + ((right - left) / 2);// 防止溢出 等同于(left + right)/2
if (nums[middle] > target) {
right = middle - 1; // target 在左区间,所以[left, middle - 1]
} else if (nums[middle] < target) {
left = middle + 1; // target 在右区间,所以[middle + 1, right]
} else { // nums[middle] == target
return middle; // 数组中找到目标值,直接返回下标
}
}
// 未找到目标值
return -1;
}
int main(){
vector<int> test={1,2,3,4,5,6,7,8,9};
cout<<search(test,1)<<endl;
}
简单的应用:
/*
给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。
你可以假设数组中无重复元素。
示例 1:
输入: [1,3,5,6], 5
输出: 2
示例 2:
输入: [1,3,5,6], 2
输出: 1
示例 3:
输入: [1,3,5,6], 7
输出: 4
示例 4:
输入: [1,3,5,6], 0
输出: 0
*/
#include<iostream>
#include<vector>
using namespace std;
int search(vector<int>& nums, int target) {
int left = 0;
int right = nums.size() - 1; // 定义target在左闭右闭的区间里,[left, right]
while (left <= right) { // 当left==right,区间[left, right]依然有效,所以用 <=
int middle = left + ((right - left) / 2);// 防止溢出 等同于(left + right)/2
if (nums[middle] > target) {
right = middle - 1; // target 在左区间,所以[left, middle - 1]
} else if (nums[middle] < target) {
left = middle + 1; // target 在右区间,所以[middle + 1, right]
} else { // nums[middle] == target
return middle; // 数组中找到目标值,直接返回下标
}
}
// 未找到目标值
return left;
}
int main(){
vector<int> test={1,2,3,5,6};
cout<<search(test,4);
}
变式
重复元素
如果有重复元素,需要区分“向左收缩”和“向右收缩”这两种方式,从而能分别找到重复元素的边界:
/*
给定一个按照升序排列的整数数组 nums,和一个目标值 target。找出给定目标值在数组中的开始位置和结束位置。
如果数组中不存在目标值 target,返回 [-1, -1]。
进阶:你可以设计并实现时间复杂度为 $O(\log n)$ 的算法解决此问题吗?
示例 1:
输入:nums = [5,7,7,8,8,10], target = 8
输出:[3,4]
示例 2:
输入:nums = [5,7,7,8,8,10], target = 6
输出:[-1,-1]
示例 3:
输入:nums = [], target = 0
输出:[-1,-1]
*/
#include<iostream>
#include<vector>
using namespace std;
// 二分查找,寻找target的右边界(不包括target)
// 如果rightBorder为没有被赋值(即target在数组范围的左边,例如数组[3,3],target为2),为了处理情况一
int getRightBorder(vector<int>& nums, int target) {
int left = 0;
int right = nums.size() - 1; // 定义target在左闭右闭的区间里,[left, right]
int rightBorder = -2; // 记录一下rightBorder没有被赋值的情况
while (left <= right) { // 当left==right,区间[left, right]依然有效
int middle = left + ((right - left) / 2);// 防止溢出 等同于(left + right)/2
cout<<left<<" "<<middle<<" "<<right<<endl;
if (nums[middle] > target) {
right = middle - 1; // target 在左区间,所以[left, middle - 1]
} else { // 当nums[middle] == target的时候,更新left,这样才能得到target的右边界
left = middle + 1;
rightBorder = left;
}
}
cout<<endl;
return rightBorder;
}
// 二分查找,寻找target的左边界leftBorder(不包括target)
// 如果leftBorder没有被赋值(即target在数组范围的右边,例如数组[3,3],target为4),为了处理情况一
int getLeftBorder(vector<int>& nums, int target) {
int left = 0;
int right = nums.size() - 1; // 定义target在左闭右闭的区间里,[left, right]
int leftBorder = -2; // 记录一下leftBorder没有被赋值的情况
while (left <= right) {
int middle = left + ((right - left) / 2);
if (nums[middle] >= target) { // 寻找左边界,就要在nums[middle] == target的时候更新right
right = middle - 1;
leftBorder = right;
} else {
left = middle + 1;
}
}
return leftBorder;
}
vector<int> searchRange(vector<int>& nums, int target) {
int leftBorder = getLeftBorder(nums, target);
int rightBorder = getRightBorder(nums, target);
// 情况一
if (leftBorder == -2 || rightBorder == -2) return {-1, -1};
// 情况三
if (rightBorder - leftBorder > 1) return {leftBorder + 1, rightBorder - 1}; //注意这里有一个处理
// 情况二
return {-1, -1};
}
int main(){
vector<int> test={1,2,3,3,4,4,9};
cout<<searchRange(test,3)[0]<<","<<searchRange(test,3)[1]<<endl;
}
可能应用场景
- 数据库索引 背景:数据库使用索引来加速数据查询,索引通常是有序的数据结构。
需求:快速查找和插入记录,以保证查询和更新操作的高效性。
应用场景:关系数据库管理系统(如MySQL、PostgreSQL)中的B树或B+树索引。
- 搜索引擎 背景:搜索引擎需要维护大量的索引数据,以便快速响应用户查询。
需求:快速插入新的索引条目(如新网页)和查找已有的索引条目。
应用场景:网页搜索引擎(如Google、Bing)中的倒排索引。
- 缓存系统 背景:缓存系统用于存储经常访问的数据,以加速访问速度。
需求:快速查找缓存数据和插入新的缓存数据。
应用场景:网页缓存(如CDN)、内存缓存(如Redis、Memcached)