在过去的几年里,社会上做了很多努力来增加女性在科技界的代表,女性在机器学习和数据科学领域也作出了重大贡献。然而,在数据科学领域,当涉及到女性的代表性时,似乎并不是每件事都是那么“狂热”。男女比例仍然不平衡,女性担任的领导职位仍然比男性少得多。但我们不要只是假设,而是要用数据来验证假设。
最近,本文作者 Parul Pandey 参加了 Kaggle2019 年度 ML & DS 挑战赛,该赛事旨在全面了解数据科学和机器学习的现状。本次挑战的挑战目标是,通过叙述性文本和数据探索结合,讲述特定的一组数据科学和机器学习从业人员的故事。Parul Pandey 将调研目标锁定在了全球女性机器学习和数据科学从业者身上,她也凭借调研数据集获得了赛事奖项。
本文总结了女性从业者在全球 ML&DT 领域的从业现状及 Parul 在调查过程中的见解。
多数受访者来自美国、印度
在 2019 年度的调查中,大多数受访者(男性和女性)都来自印度,紧随其后的是美国,这两个国家占到了总调研人数的 50%以上。其中,来自中国的男性参与者占到了 4.42%,女性参与者占到了 3.92% 。
所有参与调研的人按照性别、年龄、国家、受教育程度、职业、薪资。
性别鸿沟
在调查中,男性和女性受访者之间存在惊人的差异。大约 82%的受访者是男性,而只有 16%是女性。从性别分布来看,最近三年以来,女性工程师的参与率一直很低,分别是 16.7%,16.8%,16.3%。
中国的女性受访者约占 3%
2019 年的大多数女性受访者来自印度和美国;中部非洲的参与比例令人震惊,尽管像尼日利亚这样的国家确实在世界地图上表明了自己的存在。参与人数 TOP20 的国家中,中国的女性受访者位居第 7 位,占比约 3%左右。
在 2017 年和 2018 年,美国的女性受访者人数大大高于印度。然而,在 2019 年,印度的女性受访者人数有所增长,其比例超过了美国女性。与往年相比,2019 年对调查做出回应的非洲女性人数有所增加。
青年女性占比最高
大部分女性受访者处于(25 -29)岁年龄段,紧随其后的是(22-24)岁年龄段。因此,大多数女性受访者处于(20-30)岁年龄段。有趣的是,年龄在 60 和 70 岁以上的女性也对调查做出了回应。
来自中国的受访者中,占比最多的是 20-29 岁的女性,其次是 40-49 岁的女性和 30-39 岁的女性。来自印度的大多数女性受访者由 20 多岁的女性组成,这一比例也高于其他任何国家。另外,在印度,年龄在 18 至 21 岁之间的女性受访者人数也很多,这个年龄段通常由学生组成。对于美国女性而言,学生受访者所占的百分比相对较少。与其他国家一样,各个年龄段的分布几乎相同。
46%的女性受访者拥有硕士学位
再来看看女性受访者的受教育程度,大多数(〜46%)拥有硕士学位,紧随其后的是学士学位(27%),有 16%的博士参与了调查。分析还显示,有一定比例的人在高中毕业后没有接受过正规教育。
在美国有女性的最大数量与硕士,和博士学位,印度紧随其后。印度以最高的学士学位数居榜首,这与大多数女性受访者都是 20 多岁的学生有关。在除日本以外的所有国家中,硕士学位的地位普遍高于其他学位。中国的受访者中以硕士学位占比最高,其次是学士学位。
女性受访者多是数据科学家
自 2017 年以来,数据科学家似乎是女性受访者的主要角色/职业,其次是数据分析师。在人群中还可以看到其他角色,例如开发人员,研究人员和项目经理。如果我们从结果中排除学生,则数据科学家(〜19.5%)构成了接受调查的人群的大部分,此外数据分析师的角色(〜11%)。
不包括学生,美国是参加调查的数据科学家和数据分析人员最多的国家,其次是印度。印度的软件工程师人数最多。中国参与调研的人中,数据科学家和数据分析人员最多,其次是学者。
与男性不同,没有女性受访者的年收入高于 50 万美元。
薪水是保留和获得新人才的重要动机。女性在在数据科学领域的收入如何?我分析了 2019 年女性受访者的工资总体趋势,然后将该趋势与 2018 年的工资进行了比较。
大多数女性受访者不愿透露自己的年薪。在其余的人中有约 10%年薪不到 1000 美元。这是有一定道理的,因为受访者中有很大一部分是目前可能没有长期工作的学生。还有一小部分女性年收入超过 20 万和 30 万美元。
与 2018 年薪资范围进行比较后发现,与 2018 年不同,2019 年确实有一些女性收入超过 50 万美元。
男女的总体薪资趋势保持不变,大多数人的收入不足 1000 美元。但是,收入低于 1000 美元的女性中,女性的比例要高于男性。此外,与男性不同,没有女性受访者的年收入高于 50 万美元。
2019 年男女受访者薪资比较
收入低于 1000 美元的女性数据科学家所占的百分比与男性相比要高得多;女性数据科学家的薪水似乎也较高;收入超过 20 万美元的女性数据科学家所占的百分比要低得多。
2019 年男性和女性数据科学家的薪资比较
从全球女性科学家的薪资情况看,美国的数据科学家的薪资相对高于其他国家。
全球女性科学家的薪资
总结
通过此次调研所取得的一些重要收获可以归纳为六个关键点:
1、妇女参与这项调查的比例很低,而且多年来没有显示出太大的改善。我们需要看到如此低的参与率背后的原因,以及如何能够鼓励妇女更多地参与。
2、美国和印度女性的反应令人振奋,尽管与男性相比仍然很低。随着尼日利亚和阿尔及利亚等国的努力,非洲表现出了一线希望。组织应与非洲政府和非政府组织合作,为这些妇女提供更好的学习和研究机会。
3、数据科学领域的年轻女性人口呈上升趋势,其中大部分来自印度。应该通过改革现有的印度教育模式并在其当前课程中引入高质量的数据科学课程来有效地利用这种人口红利。
4、理科领域的女性素质很高,其中大多数都拥有硕士学位。
5、大多数女性数据科学家都位于和印度。
6、这些年来,薪水分配一直保持不变,但与美国同行相比,印度女性数据科学家的薪水相对较低。
结论
让我们回到最初的问题 — 极客女孩在崛起吗?
坦率来讲,在一些领域已显示出有所改进的迹象,而其他领域则需要大量工作。总体而言,事情看起来是有希望的。
数据科学本身就是多种科学学科的结合,吸引来自不同性别,背景和种族的人变得更加有意义,他们可以带来更多的创造力,并使知识,发现和创新蓬勃发展。
这将需要社会的共同努力,以使多样性和包容性成为生态系统的重要组成部分。作为女性,我们应确保我们建立一个积极的支持小组,以在数据科学领域协助其他女性。毕竟,赋权的妇女赋予妇女权力。
原文链接:
https://towardsdatascience.com/geek-girls-rising-myth-or-reality-81e1897433c8
评论