如何在 Power BI 中基于多个列应用 RLS-开发者社区

原文：towardsdatascience.com/how-to-apply-rls-based-on-multiple-columns-in-power-bi-2c67f980983f?source=collection_archive---------10-----------------------#2024-05-23

通常，RLS 数据访问是基于单列的数据。但有时，数据访问必须由多个列来控制。我们该如何做到这一点呢？

https://medium.com/@salvatorecagliari?source=post_page---byline--2c67f980983f--------------------------------https://towardsdatascience.com/?source=post_page---byline--2c67f980983f-------------------------------- Salvatore Cagliari

·发布于Towards Data Science ·10 分钟阅读·2024 年 5 月 23 日

–

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/868453421bb3d279cd880b302dec21af.png

图片由Patrick Robert Doyle提供，来自Unsplash

介绍

在之前的文章中，我详细介绍了如何使用行级安全性（RLS）在 Power BI 中进行数据访问。我探讨了基础知识，并深入研究了高级技巧，现在我想讨论如何基于多个列来实现 RLS。

在“正常”情况下，我可以根据某一列中的数据控制对数据的访问。

在这种情况下，RLS 角色可能相对简单，正如我在之前的关于 RLS 的文章中所描述的那样：

## 探索实现 RLS 规则的所有方法

在 Power BI 中实现行级安全性是开发人员常遇的任务。让我们来看看实现这一目标的技巧……

towardsdatascience.com

即使我们需要检查 RLS 角色中的多个列，我们也可以创建一个 RLS 表达式来通过LOOKUPVALUE()函数来处理此问题。

然而，我想在本文中进一步讨论，加入一种建模技巧，简化 RLS 角色中的 DAX 表达式。

目标是如何准备数据，将 RLS 角色简化到最小：

Email=USERPRINCIPALNAME()

但首先，我必须向你展示数据和其中的挑战：

场景和我们的数据

首先，让我们看看我的数据。

我的公司，Evergreen Products，有一份员工列表，列出了他们在组织层级中的职位：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/74c4919794043e9bd63e3cf83397e8f1.png

图 1 — 我的数据摘录，展示了不同层级的几位经理（作者绘制）

看看这三位标记的经理。三位经理都负责一个层级中的分支，从不同的层级开始。

Andrea Adams 负责整个销售团队。
Andrea Madson 负责中央地区的销售。
John Carter 负责大宗产品的生产。

每位经理必须能够访问组织内整个分支。

这里的挑战是如何高效地实现这一点。

我可以编写一个漂亮的 DAX 表达式，并用一些魔法来实现这个 RLS 角色中的功能。

但是每当用户访问这个数据模型时，这个魔术般复杂的 DAX 表达式会被执行，可能会大大减慢报告的速度。

我想避免这个问题。

准备数据模型

好的，我该如何解决这个挑战？

我必须添加计算表和列，以将每位经理与他以及所有下属的组织单位在层级中的映射起来。

逻辑目标数据模型如下所示：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/31a6e37a4afbe44f11f3efc6f2073093.png

图 2 — 逻辑目标数据模型（作者绘制）

RLS-Access 表是我将在其中应用 DAX 表达式的 RLS 角色表。

我写下了“逻辑目标数据模型”，因为最终的数据模型将包含一个额外的表格。不过稍后会详细介绍。

我将使用 Power Query 创建这些表，而不是 DAX，因为这种方法能更高效地存储数据模型中的数据。

首先，我需要一个包含每个层级的“Key”列。

为此，我将把每个层级连接成一个键列。每个层级的列通过下划线分隔，使用以下 M 表达式：

[Org Level1]&"_"&(if[Org Level2]=null then""else[Org Level2])&"_"&(if[Org Level3]=null then""else[Org Level3])&"_"&(if[Org Level4]=null then""else[Org Level4])&"_"&(if[Org Level5]=null then""else[Org Level5]))

我必须添加多个“if”语句，以覆盖空单元格。

这是因为我从 SQL Server 数据库中获取数据，表达式被转换为 SQL 并发送到源数据库（参见查询折叠）。

在 SQL 中将数据与空数据（NULL）连接会导致结果为空。

接下来，我将通过引用员工表创建一个新表，但只保留必要的列：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/df7222dd356c81fc801d8ede02ce1cbf.png

图 3 — RLS-Access 表摘录（作者绘制）

然后，我过滤此表格，只保留经理，通过将 IsManager 列过滤为 True。

不幸的是，这还不够。

我仍然无法基于多个层级控制数据访问。

为了解决这个问题，我需要一个映射表，将 RLS-Access 表和员工表连接起来，映射每个层级与每个角色组合之间的关系。

我通过将 RLS-Access 表相乘并附加每个变体，形成一个大型映射表来实现这一点。

这个映射表是我上面将数据模型称为“逻辑”的原因，因为它只是一个技术上的必要性，而不是一个与业务相关的表。

完整的技术数据模型如下：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/91b18d1905178fd198bfac80dbc50a7a.png

图 4 — 完整技术数据模型（图源：作者）

创建映射表

我需要做的是为每个层级创建一张表，其中每个层级有一组行。

例如，我将为整个层级创建一组映射到 CEO 顶层的映射。

然后，我将为 CEO 以下的管理层创建一组，以此类推。

我在 Power Query 中创建一个名为 CEOLevel 的新引用，来源于员工表。

接下来，我删除“ID”、“FirstName”、“LastName”、“Name”和“EMail”列。

然后，我添加一个新的计算列，称为 RLS-Key，使用以下 M 表达式：

[Org Level1]&"_CEO___"

最后，我删除所有列，保留层级键和新的 RLS-Key 列。

表格现在看起来是这样的：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c14bef2e9e056f05771b9e0016f4cf63.png

图 5 — 从 CEO 层级表中提取数据（图源：作者）

该表包含每个现有组织单元的行，以便 CEO 可以访问所有这些单元。稍后我将解释其机制。

该表设置为不加载到 Power BI 中：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/95f7add36551a9abe29ce9b61efa71b3.png

图 6 — 禁用 CEOLevel 表的加载（图源：作者）

这是因为它是一个中介表，将作为构建最终“RLS-Mapping”表的构建块使用。

现在，我重复这些步骤，创建一个名为 OrgLevel2 的另一个中介表。

但创建 RLS-Key 列的表达式是不同的：

[Org Level1]&"_"&(if[Org Level2]=null then""else[Org Level2])&"___"

如您所见，结果中我通过这个表达式包括了组织的第二级：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/e0093ddd263d5a81e4d640361e0bb73d.png

图 7 — OrgLevel2 表的提取数据（图源：作者）

基于这些步骤，我复制 CEOLevel 表并重复这些步骤，为 OrgLevel3–5 创建另外三个中介表。

对于每个表，我修改 RLS-Key 列的表达式，加入层级中的另一级：

对于 OrgLevel3，我使用以下表达式：

[Org Level1]&"_"&(if[Org Level2]=null then""else[Org Level2])&"_"&(if[Org Level3]=null then""else[Org Level3])&"__"

请注意，我每次在代码的最后一行中删除一个下划线，因为它包含在表达式的前一部分中。

这是 OrgLevel4 的情况：

[Org Level1]&"_"&(if[Org Level2]=null then""else[Org Level2])&"_"&(if[Org Level3]=null then""else[Org Level3])&"_"&(if[Org Level4]=null then""else[Org Level4])&"_"

最后，对于 OrgLevel5，不会有最终的下划线，因为第五级是层级中的最后一级：

[Org Level1]&"_"&(if[Org Level2]=null then""else[Org Level2])&"_"&(if[Org Level3]=null then""else[Org Level3])&"_"&(if[Org Level4]=null then""else[Org Level4])&"_"&(if[Org Level5]=null then""else[Org Level5])