写点什么

Pymetrics 开源公平性感知机器学习算法 Audit AI

  • 2018-08-02
  • 本文字数:1218 字

    阅读完需:约 4 分钟

Pymetrics 是一件专注于向企业提供招聘服务的初创企业。最近,Pymetrics 在 Github 上开源了企业使用的偏差检测(bias detection)算法,称为“Audio AI”。Audit AI 用于降低存在于训练数据集中的判别模式。这些判别模式会改进或影响机器学习算法在选取总体上的概率。

现在,越来越多的工作任务借助于机器学习实现过程自动化。重要的是应确保这些算法不会产生可从中不当受益的偏差。Pymetrics 一直致力于确保机器学习算法的公平性。

我们研究的总体目标,就是提出一种合理的考虑问题方式,使机器学习算法更公平。即便识别了训练数据集中存在的偏差,使用该训练集训练的机器学习算法并不足以解决其中的判别问题。当前,越来越多的决策使用人工智能自动做出。人们需要理解并识别算法的公平或偏差程度,这是朝正确方向迈出的一步。

企业对多样性的关注与日俱增。一些人担心算法学习偏差的方式事实上可能会破坏这些多样性努力。最近,法国宣布希望成为能在国际舞台占有一席之地的人工智能强国。今年三月,法国总统 Emmanuel Macron 发布了人工智能国家战略,其中包括在未来五年内支出 18.5 亿美元,发展可与硅谷和中国竞争的生态系统。总统做出如此层次的 AI 投资,这无疑是经过了仔细的考虑:

我认为 AI 完全可能危及民主。例如,我们正在使用人工智能来组织学生访问大学,对算法委以重任。很多人认为算法是一个黑箱,他们并不明白选取学生的过程是如何发生的。但当他们开始明白这依赖于某种算法时,算法就具有了特定的责任。要避免争议的发生,必须为算法创造公平性和完全透明性的条件。这样的算法中并不存在偏见,至少不存在歧视性偏见,我对此充满信心。

对于法国而言,“公平”的算法可确保在性别、年龄及其它个体特征上不存在偏见。如果算法中并未建立公平性和透明度,那么 Macron 总统预计“人们最终会拒绝这种创新”。

Pymetrics 的客户包括消费品企业、技术企业和研究企业。Pymetrics 提供的部分产品是为应聘候选者给出了一套参与性游戏。这些游戏通常完成于招聘的前期过程,完全不考虑应聘者的种族、性别和教育水平等个体特征,而是基于应聘者的记忆、对风险的态度等近 80 个特征做出评估。之后,Pymetrics 就能够针对已有的最佳表现者对应聘者做出评定,预测应聘者在应聘职位上可能的未来表现。

出于社会责任上的考虑,Pymetrics 选择开源 Audit AI。Pymetrics 的产品负责人 Priyanka Jain 给出了解释:

作为技术的创造者,我们十分强烈地感受到,我们的责任就是构建人工智能,努力创造一个人人希望生活于其中的未来。如果我们可以为其他技术创造者继续构建特性提供帮助,那么我们责无旁贷应做出共享。

Audit AI 的 Github 代码库中,开发人员可以看到一个用于实现上述“公平”的机器学习算法的 Python 软件库,该软件库是基于 pandas 和 sklearn 构建的。此外,代码库还给出了两个示例数据集,场景分别涉及德国的学分和学生的成绩。

查看英文原文: Pymetrics Open-Sources Fairness-Aware Machine Learning Algorithms

2018-08-02 09:161643
用户头像

发布了 391 篇内容, 共 142.3 次阅读, 收获喜欢 257 次。

关注

评论

发布
暂无评论
发现更多内容

为什么你的网站需要搭建在线帮助中心?

小炮

2022 支付宝五福 |“联机版”打年兽背后的网络技术 RTMS

阿里巴巴终端技术

客户端 网络技术 网络通信

“东数西算”与“双碳”双驱力叠加,新华三争当“全能型选手”

BeeWorks

Redis 忽然变慢了如何排查并解决?

码哥字节

redis Redis 核心技术与实战 6月月更

自助洗车机还能加盟你不知道吧?

共享电单车厂家

自助洗车机 自助洗车加盟

有了这个云端Mock功能,你的简历起码提升30分!

Liam

前端 Postman 前端教程 API文档 前端工具

英特尔计划建造浸没式实验室,帮助高功率芯片快速降温

BeeWorks

6 月直播 7 场干货全剧透!今天:飞腾CPU调优原理及方法 | 第 19 期

OpenAnolis小助手

cpu 直播 sig 龙蜥大讲堂 飞腾

为企业业务流程提速的BPM

力软低代码开发平台

幸运哈希算法竞猜游戏开发特点分析(成熟方案)

开发微hkkf5566

【高并发】你知道吗?大家都在使用Redisson实现分布式锁了!!

冰河

并发编程 多线程 高并发 异步编程 6月月更

展示 Postlight 的 WordPress + React Starter Kit

海拥(haiyong.site)

WordPress 6月月更

24小时无人自助洗车要如何加盟?

共享电单车厂家

自助洗车加盟

6元自助洗车机一般都什么价位

共享电单车厂家

自助洗车加盟 6元自助洗车机

Jetpack Composes 入门

坚果

6月月更

运维领域告警智能定级原理探索(含详细实验报告)

云智慧AIOps社区

运维 安全 监控 告警

2022年4月线上终端药品增长迅猛,市场政策合规进程加快

易观分析

医药类

定档615 | 数字化基础软件自主创新分享周即将来袭,点击获取“通关密钥”!

网易数帆

大数据 云原生 基础软件 数字化转型 自主创新

移动端异构运算技术-GPU OpenCL编程(进阶篇)

百度Geek说

顶级好用的 React 表单设计生成器,可拖拽生成表单

蒋川

低代码 开发工具 React 表单 组件

哪些人比较适合加盟自助洗车

共享电单车厂家

加盟自助洗车

洗车行业前景好不如开个自助洗车店

共享电单车厂家

自助洗车加盟 开自助洗车店

相约龙蜥,开源一“夏”!2022编程之夏ASoC开始报名了

OpenAnolis小助手

阿里巴巴 开源项目 龙蜥社区 高校学生 技术项目

招聘 | 上班轰趴,下班狼人杀,天天招人,怕是要发!

Alluxio

面试 程序员人生 招聘 互联网热点 Alluxio

CPU利用率从10%提升至60%:中型企业云原生成本优化实战指南

星汉未来

运维 云原生 IT成本 星汉未来 FinOps

如何撰写数据中台蓝图方案

agileai

数据中台 企业服务总线 主数据平台 数据分析平台 蓝图方案

2022云原生网络趋势 | K8s托管整个基础设施、多云、边缘计算、安全等场景,将云原生网络带向新战场

York

云原生 网络 Kube-OVN cni 6月月更

成本节省 50%,10 人团队使用函数计算开发 wolai 在线文档应用

Serverless Devs

Serverless wolai

WASM VS EVM,波卡的选择预示了公链未来

One Block Community

区块链 公链 波卡生态

各国儿童节时间是不一样的

清林情报分析师

数据可视化 知识图谱 儿童节

博睿数据拨测入场加速广电深度融合

博睿数据

智能运维 博睿数据 智慧广电

Pymetrics开源公平性感知机器学习算法Audit AI_开源_Kent Weare_InfoQ精选文章