LeetCode 3531 – Count Covered Buildings 题解-开发者社区

LeetCode 3531 – Count Covered Buildings 题解

给定一个正整数 n 表示一座 n x n 的城市网格,以及一个数组 buildings,其中 buildings[i] = [x, y] 表示在坐标 (x, y) 上有一栋建筑,且所有坐标互不相同。leetcode

如果某栋建筑在四个方向上都至少有一栋其他建筑(左、右、上、下),则称这栋建筑是「被覆盖的」。形式化地说,对建筑 (x, y):

同一行 x 上,存在列坐标小于 y 的建筑(左边);
同一行 x 上,存在列坐标大于 y 的建筑(右边);
同一列 y 上,存在行坐标小于 x 的建筑(上边或下边,取决于坐标系约定);
同一列 y 上,存在行坐标大于 x 的建筑(与上一个相反方向)。

问:共有多少栋建筑是被覆盖的?leetcode

朴素直觉:从每栋建筑向四个方向扫

一开始很自然的想法是:

遍历每一个建筑 (x, y);
向左、向右、向上、向下在整个 n x n 网格上「扫」一条线,看看能不能找到其他建筑;
如果四个方向都找到了,就把答案加一。

这个思路在正确性上其实没问题,因为定义就是这样:四个方向上只要能找到至少一栋建筑就行。问题在于效率。

约束中 n 最多可以到 10^5,buildings.length 也可以到 10^5。leetcode

如果你真在网格上按行、按列一路扫到边界,最坏情况下:

对每栋建筑,向某个方向扫描要走 O(n);
有 4 个方向,因此大约 O(4n);
一共有 m = buildings.length 栋建筑,总复杂度约是 O(m · n)。

在 n 和 m 都到 10^5 量级时,O(m · n) 接近 10^10 级别,完全超出可接受范围,这就是面试官会否掉这种方案的原因。

换个视角:真正「需要」的信息是什么?

关键问题是:判断 (x, y) 是否被覆盖,真的需要在网格上一个格子一个格子地扫吗?

观察定义可以发现,只关心「有没有建筑」,而且只在同一行和同一列上:youtube algo

对水平方向:

是否存在 (x, y_left),使得 y_left < y?
是否存在 (x, y_right),使得 y_right > y?

对垂直方向:

是否存在 (x_up, y),使得 x_up < x?
是否存在 (x_down, y),使得 x_down > x?

换句话说,只要知道:

在行 x 里,所有建筑的列坐标的最小值和最大值;
在列 y 里,所有建筑的行坐标的最小值和最大值;

就可以知道 (x, y) 是否被「夹在中间」。algo youtube

核心思路:按行按列维护最小/最大坐标

下面是一个非常高效、又很「面试友好」的做法:

第一步:按行、按列收集坐标

对每一栋建筑 (x, y):

在「按行」的结构里,把该行的 y 放进去;
在「按列」的结构里,把该列的 x 放进去。

可以用两种方式来实现:

使用 map + 排序,维护每一行/每一列的一个排序后的坐标列表;algo
或者更直接地,为每行维护 minY[x] 和 maxY[x],为每列维护 minX[y] 和 maxX[y]。linkedin

只维护最小/最大更轻量,这里用这种版本来说明思路。

初始化:

minY[x] 初始为一个极大值,maxY[x] 初始为一个极小值;
minX[y] 和 maxX[y] 同理。

遍历所有建筑 (x, y) 时:

minY[x] = min(minY[x], y);
maxY[x] = max(maxY[x], y);
minX[y] = min(minX[y], x);
maxX[y] = max(maxX[y], x)。youtube linkedin

这一趟遍历是 O(m)。

直觉上:

minY[x] 就是这一行最左边的建筑;
maxY[x] 就是这一行最右边的建筑;
minX[y] 是这一列最上/下边(取决于坐标系)的建筑;
maxX[y] 是这一列最下/上边的建筑。

第二步:判断每栋建筑是否「被夹住」

再遍历一遍 buildings,对于每个 (x, y),检查:youtube algo

左边是否有建筑:minY[x] < y;
右边是否有建筑:maxY[x] > y;
上边是否有建筑:minX[y] < x;
下边是否有建筑:maxX[y] > x。

如果四个条件全部满足,就说明 (x, y) 在行上被左右夹住、在列上被上下夹住,是一个被覆盖的建筑,答案加一。algo youtube

从更直观的角度看:

minY[x] < y < maxY[x] ⇒ 同一行里它不是最左也不是最右,两侧都有建筑。
minX[y] < x < maxX[y] ⇒ 同一列里它不是最上/最下,两侧都有建筑。

复杂度分析

第一次遍历:更新每行/每列的最小值和最大值,时间 O(m)。algo
第二次遍历:对每栋建筑做 O(1) 判断,时间也是 O(m)。algo
总时间复杂度O(m),空间复杂度是 O(n) 级别用来存储这些最值信息,非常适合在面试中展示。

细节补充:一些边界与剪枝

还可以做一个小优化:

要在一行里有「左和右」两个方向,至少得有 3 栋建筑;
要在一列里有「上和下」两个方向,同样至少得有 3 栋建筑。algo

所以在第二次遍历建筑时,可以:

统计每行 cntRow[x] 和每列 cntCol[y] 的建筑数量;
如果 cntRow[x] < 3 或 cntCol[y] < 3,这栋建筑肯定不可能被覆盖,可以直接跳过判断。algo

这个剪枝在数据比较分散时很划算,也能给面试官展示你对条件的深入理解。

参考代码示例(伪代码风格)

下面是接近实际代码的伪代码结构,和上面描述一致:

function countCoveredBuildings(n, buildings): // 假设行和列都是 1..n INF = +∞ // 用数组或哈希表都可以 minY = array[1..n] filled with INF maxY = array[1..n] filled with -INF minX = array[1..n] filled with INF maxX = array[1..n] filled with -INF cntRow = array[1..n] filled with 0 cntCol = array[1..n] filled with 0 // 第一次遍历:更新最值和计数 for (x, y) in buildings: minY[x] = min(minY[x], y) maxY[x] = max(maxY[x], y) minX[y] = min(minX[y], x) maxX[y] = max(maxX[y], x) cntRow[x] += 1 cntCol[y] += 1 ans = 0 // 第二次遍历:判断是否覆盖 for (x, y) in buildings: // 剪枝:行或列少于 3 栋,直接不可能 if cntRow[x] < 3 or cntCol[y] < 3: continue if minY[x] < y and y < maxY[x] and minX[y] < x and x < maxX[y]: ans += 1 return ans

这一解法的核心在于:把「是否有建筑」抽象成「是否在最小值和最大值之间」,避免对网格做任何无谓的扫描。linkedin youtube