news 2026/3/23 11:32:48

如何更好地作为数据科学家进行沟通

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何更好地作为数据科学家进行沟通

原文:towardsdatascience.com/how-to-better-communicate-as-a-data-scientist-6fc5428d3143

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/57303eba632bf29139041b123b635534.png

图片由作者提供

在我之前的文章中,我提出了“*沟通我们的工作与编写代码、构建模型和产品以完成任务一样重要。”*的观点。

不幸的是,在现实中,我观察到许多数据科学家(尤其是初级数据科学家)在工作的讲故事部分上挣扎。他们手头有所有数据,但不知何故,信息似乎并没有传达给观众,分析最终变成了一份摆放在书架上的漂亮报告,无人问津,毫无影响。那么到底出了什么问题?

这里有一些我在这些年里学到的技巧,这些技巧将帮助你们作为数据科学家提高沟通能力。

始终使用金字塔原则

许多数据科学家以线性方式沟通(如图表左侧所示)。这是可以理解的,因为这是我们体验事物的方式,也是我们在日常生活中讲故事的方式。但这种方式并不是传达重要信息的最有效方式,因为听众在这种沟通中很容易迷失或感到无聊。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/3dc6c01a096e88ba43fa46cf9d261575.png

图片由作者提供

在商业沟通中,金字塔原则是金标准——如图表右侧所示。简单来说,始终从最重要的信息开始——洞察力;然后深入到细节。

与报纸文章的标题相似,洞察力会吸引观众的注意力。它们是你最终想要传达的内容,因此你需要将它们放在最前面。如果观众对细节感兴趣,他们会继续阅读(倾听);如果不感兴趣,他们会得到最重要的信息。

清理格式和语法

这可能看起来像是吹毛求疵,但让我告诉你为什么它可能比你想象的更重要。

我们大多数人知道阿尔伯特·梅拉比安的“7-38-55”口头沟通法则,它强调只有 7%的沟通是关于实际内容的,其余的是语气(38%)和肢体语言、面部表情等(55%)。当涉及到书面沟通时,可能不会那么极端,但你可以确信,你工作的视觉呈现已经在无声中传达了工作的质量。

当人们打开一个文档,里面包含着不同字体的数字和段落,没有正确的缩进,满是拼写错误的下划线等,他们很可能会开始怀疑分析过程中投入的勤奋程度,以及由此延伸出的结论质量。

这也是对观众的不尊重;混乱的格式会给读者带来额外的心理负担,他们必须弄清楚这一切。

那么你该如何着手呢?

一般的规则是尽可能使数字易于消化,并去除所有无用的细节。

让我用一个例子来演示我的意思:假设你想要传达关于用户基础构成的洞察,按国家划分。

一些数据科学家可能会展示如下:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/21b5029163457b4f19d9f87b982ba99c.png

图片由作者提供

你可以立即做的几件低努力的事情:

  • 将数字格式更改为分隔千位的格式(在 Excel / Google Sheets 中,更改为“数字”格式并删除小数点

  • 按降序排列,以便信息更容易消化

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5e9e3ddbf409a31fd0b1540477933f1d.png

图片由作者提供

详细数字更难理解。根据受众,他们可能不需要那么详细的程度,因此你可以进一步简化,并用千为单位表示数字:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/085ff9cbf4947e1f72000df6083b56ef.png

图片由作者提供

选择合适的图表来传达你的观点

你选择的图表类型可能会凸显或埋没你的洞察力;图表应该作为对观众的一种视觉辅助。能够判断哪种图表/表格可以更有效地传达洞察力是数据科学家应具备的关键能力。

在上面的例子中,你最终的目标可能是传达按国家划分的会员基础。饼图比原始数字表或柱状图提供更直观的视觉效果,并且更容易判断每个桶的相对大小。

看看下面的图表,即使没有任何叙述,我也可以直观地得出一些洞察,比如“我们会员基础的超过一半居住在美国”或“德国、英国和意大利的用户数量相似”。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/a7f5d6361c62d351d4f05d33bf60a95d.png

图片由作者提供

专注于重要的数字,而不是展示所有数字

沟通就是关于优先级。你不必包含所有数字,仅仅因为你拥有它们。你想要帮助读者集中注意力,而不是用无关信息分散他们的注意力。

以我们的例子继续,展示长尾数字真的有意义吗?很可能没有。注意,上面自动生成的饼图已经出于这个原因隐藏了一些国家——它们太小,无关紧要,所以没有必要将它们挤到图表上。

因此,更好地呈现数据的方法是要么将长尾分组(在脚注中描述分组包含的内容)要么完全去除(如果它是另一种类型的图表,如分布图,而长尾不提供任何价值)。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/00a2219e17ac35509a2a1fc4ce2277de.png

图片由作者提供

请记住,没有经过练习,用数据有效地讲故事的能力是不会自然产生的。但这是区分优秀数据科学家和一般数据科学家的关键技能之一。

最佳的练习方式是通过实践。当有机会进行展示时,抓住机会,与队友或经理进行模拟演练,并在展示前后获取反馈。

想要关于如何成为更优秀数据科学家的文章?以下是一些建议:

一个能让你成为更优秀数据科学家的思维转变

如何让自己作为数据科学家更具抗裁员能力

软技能是你在数据科学面试中脱颖而出的关键

我在数据科学职业生涯中希望避免的 5 个错误

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/20 5:46:25

官网-职工带薪年休假条例

官网:职工带薪年休假条例(国务院令第514号)_中华人民共和国中央人民政府门户网站 第一条 为了维护职工休息休假权利,调动职工工作积极性,根据劳动法和公务员法,制定本条例。 第二条* 机关、团体、企业、事业单位、民办非企业单位、有雇工的个体工商户等单位的职工连续…

作者头像 李华
网站建设 2026/3/20 8:12:26

网络流24题 加强版 P4480 [BJWC2018] 餐巾计划问题

https://www.luogu.com.cn/problem/P1251 为弱化版。 我们发现建图非常简单。拆个点,随便模拟题意连即可。 但是!网络流太笨了。加强版 P4480 就必须要贪心了。 于是我一年前用 SSP 水过了加强版 P4480。 以下变量定义按照 https://www.luogu.com.cn/problem/P1251 来,因…

作者头像 李华
网站建设 2026/3/22 14:59:44

FreeFileSync (文件夹比较同步) v14.6

下载地址 https://pan.quark.cn/s/0dbf570fa2ac 介绍 FreeFileSync是一个文件夹比较和同步软件,可以创建和管理所有重要文件的备份副本。FreeFileSync不是每次都复制每个文件,而是确定源文件夹和目标文件夹之间的差异,并仅传输所需的最少数…

作者头像 李华
网站建设 2026/3/15 10:29:04

对 Promise.race 的理解

基础问答问:有使用过 Promise.race 吗,说说他的作用。答:Promise.race 接收一个 Promise 数组(或者一个具有迭代器的对象)作为参数,返回一个新的Promise,这个新的 Promise 结果是数组中第一个状…

作者头像 李华