写点什么

Pymetrics 开源公平性感知机器学习算法 Audit AI

  • 2018-08-02
  • 本文字数:1218 字

    阅读完需:约 4 分钟

Pymetrics 是一件专注于向企业提供招聘服务的初创企业。最近,Pymetrics 在 Github 上开源了企业使用的偏差检测(bias detection)算法,称为“Audio AI”。Audit AI 用于降低存在于训练数据集中的判别模式。这些判别模式会改进或影响机器学习算法在选取总体上的概率。

现在,越来越多的工作任务借助于机器学习实现过程自动化。重要的是应确保这些算法不会产生可从中不当受益的偏差。Pymetrics 一直致力于确保机器学习算法的公平性。

我们研究的总体目标,就是提出一种合理的考虑问题方式,使机器学习算法更公平。即便识别了训练数据集中存在的偏差,使用该训练集训练的机器学习算法并不足以解决其中的判别问题。当前,越来越多的决策使用人工智能自动做出。人们需要理解并识别算法的公平或偏差程度,这是朝正确方向迈出的一步。

企业对多样性的关注与日俱增。一些人担心算法学习偏差的方式事实上可能会破坏这些多样性努力。最近,法国宣布希望成为能在国际舞台占有一席之地的人工智能强国。今年三月,法国总统 Emmanuel Macron 发布了人工智能国家战略,其中包括在未来五年内支出 18.5 亿美元,发展可与硅谷和中国竞争的生态系统。总统做出如此层次的 AI 投资,这无疑是经过了仔细的考虑:

我认为 AI 完全可能危及民主。例如,我们正在使用人工智能来组织学生访问大学,对算法委以重任。很多人认为算法是一个黑箱,他们并不明白选取学生的过程是如何发生的。但当他们开始明白这依赖于某种算法时,算法就具有了特定的责任。要避免争议的发生,必须为算法创造公平性和完全透明性的条件。这样的算法中并不存在偏见,至少不存在歧视性偏见,我对此充满信心。

对于法国而言,“公平”的算法可确保在性别、年龄及其它个体特征上不存在偏见。如果算法中并未建立公平性和透明度,那么 Macron 总统预计“人们最终会拒绝这种创新”。

Pymetrics 的客户包括消费品企业、技术企业和研究企业。Pymetrics 提供的部分产品是为应聘候选者给出了一套参与性游戏。这些游戏通常完成于招聘的前期过程,完全不考虑应聘者的种族、性别和教育水平等个体特征,而是基于应聘者的记忆、对风险的态度等近 80 个特征做出评估。之后,Pymetrics 就能够针对已有的最佳表现者对应聘者做出评定,预测应聘者在应聘职位上可能的未来表现。

出于社会责任上的考虑,Pymetrics 选择开源 Audit AI。Pymetrics 的产品负责人 Priyanka Jain 给出了解释:

作为技术的创造者,我们十分强烈地感受到,我们的责任就是构建人工智能,努力创造一个人人希望生活于其中的未来。如果我们可以为其他技术创造者继续构建特性提供帮助,那么我们责无旁贷应做出共享。

Audit AI 的 Github 代码库中,开发人员可以看到一个用于实现上述“公平”的机器学习算法的 Python 软件库,该软件库是基于 pandas 和 sklearn 构建的。此外,代码库还给出了两个示例数据集,场景分别涉及德国的学分和学生的成绩。

查看英文原文: Pymetrics Open-Sources Fairness-Aware Machine Learning Algorithms

2018-08-02 09:161416
用户头像

发布了 391 篇内容, 共 134.2 次阅读, 收获喜欢 256 次。

关注

评论

发布
暂无评论
发现更多内容

图数据 3D 可视化在 Explorer 中的应用

NebulaGraph

可视化 图数据库 3D

Go语言入门12—异常

良猿

Go golang 后端 11月月更

EMQ《物联网平台大规模数据接入和处理性能评测方法》成功入选“可信边缘计算推进计划”

EMQ映云科技

物联网 IoT 边缘计算 边云协同 11月月更

「文本检测与识别白皮书-3.2」第三节:常用的文本识别模型

合合技术团队

人工智能 机器学习 深度学习 模型 文字识别

NGINX Sprint 年度线上会议:报名通道已开启,立即预定您的 NGINX 深潜之旅

NGINX开源社区

nginx

堡垒机按什么收费?大概多少钱?有一个标准吗?

行云管家

网络安全 堡垒机 IT安全

NFTScan 与 Bitizen 钱包达成战略合作,双方将在 NFT 数据层面进行深度合作

NFT Research

NFT 数据基础设施

7k字,12张图,从零到一带你详解Redis

Java永远的神

数据库 nosql redis 程序员 面试

扒官方文档学Ts类型编程(二)

GFE

typescript 前端

图解vue3.0编译器核心原理

GFE

前端 Vue3

拥抱“大信创”浪潮,优博讯开启成长新曲线

Geek_2d6073

字节跳动开源数据集成引擎BitSail的演进历程与能力解析

字节跳动数据平台

数据库 开源 数据开发 数据集成 企业号十月 PK 榜

【愚公系列】2022年11月 Go教学课程 040-字符串处理

愚公搬代码

11月月更

网络爬虫技术及应用

郑州埃文科技

网络安全 IP地址资源 爬虫技术

量化合约对冲挖矿app软件开发案例(支持测试)

开发微hkkf5566

python小知识-classmethod类方法

AIWeker

Python 人工智能 python小知识 11月月更

详解 Serverless 架构的 6 大应用场景

阿里巴巴云原生

阿里云 Serverless 云原生

Go语言躲坑经验总结

百度Geek说

Go 企业号十月 PK 榜

平均110万个漏洞被积压,企业漏洞管理状况堪忧

SEAL安全

DevSecOps 漏洞修复 软件供应链安全 漏洞管理 漏洞优先级匹配

Spring Boot「22」使用 Hibernate & JPA 持久化 Java 对象

Samson

Java hibernate Spring Boot 学习笔记 11月月更

前端 30 问:愿你能三十而立

GFE

面试 前端

详解AQS中的condition源码原理

华为云开发者联盟

开发 华为云 企业号十月 PK 榜

【重磅】Serverless Devs 进入 CNCF 沙箱,成首个入选的 Serverless 工具项目!

阿里巴巴云原生

阿里云 Serverless 云原生

三位技术大咖的「研发效能」实践干货

万事ONES

研发效能 课程笔记

扒官方文档学Ts类型编程

GFE

typescript 前端

WEB项目如何通知用户在线更新?

GFE

前端 版本管理

Discount-industrial mini pcie card/Dual Band 2.4GHz 5GHz 2x2 MIMO 802.11ac Mini PCIE WiFi Module//QCA9880 3x3 FCC/CE/IC

Cindy-wallys

QCA9880 802.11ac 3*3 2*2 2.4G&5G

软件测试面试真题 | 说一下常用的控件定位方法

测试人

软件测试 面试题 web测试 元素定位

分布式锁实战:基于Zookeeper的实现

小小怪下士

Java zookeeper 分布式

IM消息ID技术专题(七):网易严选分布式ID的技术选型、优化、落地实践

JackJiang

网络编程 即时通讯 IM 开源im

云转售是什么意思?哪家好?理由是什么?

行云管家

云计算 企业上云 云资源 云转售

Pymetrics开源公平性感知机器学习算法Audit AI_开源_Kent Weare_InfoQ精选文章