First Position of Target

Question

Problem Statement

For a given sorted array (ascending order) and a target number, find the
first index of this number in O(log n) time complexity.

If the target number does not exist in the array, return -1.

Example

If the array is [1, 2, 3, 3, 4, 5, 10], for given target 3, return 2.

Challenge

If the count of numbers is bigger than 2^{32}, can your code work properly?

题解

对于已排序升序(升序)数组,使用二分查找可满足复杂度要求,注意数组中可能有重复值,所以需要使用类似lower_bound中提到的方法。

Java

  1. class Solution {
  2. /**
  3. * @param nums: The integer array.
  4. * @param target: Target to find.
  5. * @return: The first position of target. Position starts from 0.
  6. */
  7. public int binarySearch(int[] nums, int target) {
  8. if (nums == null || nums.length == 0) {
  9. return -1;
  10. }
  11. int start = -1, end = nums.length;
  12. int mid;
  13. while (start + 1 < end) {
  14. // avoid overflow when (end + start)
  15. mid = start + (end - start) / 2;
  16. if (nums[mid] < target) {
  17. start = mid;
  18. } else {
  19. end = mid;
  20. }
  21. }
  22. if (end == nums.length || nums[end] != target) {
  23. return -1;
  24. } else {
  25. return end;
  26. }
  27. }
  28. }

源码分析

  1. 首先对输入做异常处理,数组为空或者长度为0。
  2. 初始化 start, end, mid三个变量,这里start初始化为-1主要是考虑到end1。注意mid的求值方法,可以防止两个整型值相加时溢出。
  3. 使用迭代而不是递归进行二分查找,因为工程中递归写法存在潜在溢出的可能。
  4. while终止条件应为start + 1 < end而不是start <= endstart == end时可能出现死循环。即循环终止条件是相邻或相交元素时退出。由于这里初始化时start < end,所以一定是start + 1 == end时退出循环。
  5. 迭代终止时有两种情况,一种是在原数组中找到了,这种情况下一定是end, 因为start的更新只在nums[mid] < target.
  6. 最后判断endtarget的关系,先排除end为数组长度这种会引起越界的情况,然后再判断和目标值是否相等。

复杂度分析

时间复杂度 O(\log n), 空间复杂度 (1).
对于题中的 follow up, Java 中数组不允许使用 long 型,如果使用 long 型,那么数组大小可大 17GB 之巨!!几乎没法用。

Reference

  • 《挑战程序设计竞赛》3.1节