AICon上海|与字节、阿里、腾讯等企业共同探索Agent 时代的落地应用 了解详情
写点什么

如何检查你的项目是不是真的需要用到 AI?

  • 2018-11-23
  • 本文字数:2962 字

    阅读完需:约 10 分钟

如何检查你的项目是不是真的需要用到 AI?

AI 前线导读:


过去几年,机器学习和人工智能日新月异,在各行业都呈现火爆的态势。你是不是也跃跃欲试,想在自己的项目里也用上人工智能呢?且慢,让我们听听来自 Google 的首席决策情报工程师 Cassie Kozyrkov 的看法,她兴趣爱好广泛,涵盖了统计、机器学习 / 人工智能、数据、决策科学、艺术、戏剧等等,在自己的博客发表了大量的观点。今天 AI 前线翻译了她最新的博文 Is your AI project a nonstarter?(《如何检查你的项目是否需要人工智能?》),相信看完她的文章后,你就能够评估自己的项目,到底需不需要加上人工智能。


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)


这是一份现状核实清单,可以帮助你避免学习困难的痛苦。


如果你要深入研究机器学习或人工智能项目,在深入研究算法、数据和工程之前,你需要先参考这份清单。你可以把这份清单想象成盒子里友好的顾问。


AI 前线注:机器学习可参阅作者的另一篇文章:The simplest explanation of machine learning you’ll ever read(《机器学习极简解释》)(http://u6.gg/fpMkp)关于人工智能,可参阅作者的这篇文章:Are you using the term ‘AI’ incorrectly?(《你是否用错了“人工智能”这词?》) (http://u6.gg/fpMnU)


记住,千万不要浪费时间,不要为了 AI 而 AI。促使你想要应用人工智能的原因,应该是它能够为你做什么,而不是为了听上去有多么科幻。


本文是作者的博文 The ultimate guide to starting AI (《启动 AI 项目的终极指南》)(http://u6.gg/fpNnq)的超短版本。如果你准备使用机器学习或人工智能,我们希望,对于本文所列的所有问题,你的回答都是 “Yes”。


AI 前线注:为什么要使用机器学习或人工智能,作者写了一篇文章 Machine learning — Is the emperor wearing clothes? 《机器学习其实只是“皇帝的新衣”》娓娓道来,深入浅出,你可以看看。


如果这份清单里有任何一个问题你的回答是 No,那么你都不适合将 AI 用到你的项目中,否则你的项目就会像这幅图片里的牛一样被卡住。

开始机器学习 / 人工智能的第一步,共 22 部分:输出、目标和可行性。

  1. 把做决策的工作交给正确的人: 负责你的项目并完成这份清单的人员是否真正了解你的业务?


将决策权委托⁽¹⁾给精通业务的人员,而不是平庸的算法书呆子。


  1. 以输出为中心的构思:你是否能够解释你的系统输出⁽²⁾是什么,以及为什么这些输出是值得去做的?


首先关注你在做什么,而不是怎么做;不要把目标和手段混为一谈。


  1. 灵感来源:你是否至少考虑过将数据挖掘⁽³⁾作为从潜在的使用案例中获取灵感的一种方法?


虽然这不是强制性的要求,但是它可以有助于找到一个好的方向。


  1. 适合机器学习 / 人工智能的任务:你是否自动化了许多决策 / 标签?是否每次当你无法找到完美的答案时,都要使用机器学习 / 人工智能来帮忙?


如果你的答案是 “No”,那么这就是一个相当清晰的信号,表明机器学习 / 人工智能不适合你。


  1. 用户体验视角:你是否能够明确谁是你的目标用户?他们将如何使用你的输出?


如果你没有及早考虑用户,那么你将会受到低劣设计的影响。


  1. 伦理发展:你是否考虑过你创造出来的东西可能会影响到哪些人群?


这点对于具备快速扩展潜力的技术尤为重要。


  1. 合理预期:你是否理解你的系统可能非常出色,但它不会是完美无瑕的?你是否能够忍受你的系统偶尔会出错?


从伦理学的角度来看,你有没有想过这点意味着什么?


  1. 生产中可能的情况:无论这些决策 / 标签来自何处,你是否能够在生产中为其提供服务?你是否能够按照预期的规模来集中工程资源?

  2. 需要学习的数据:是否存在潜在有用的数据?你能获得它们的访问权限吗?


如果数据不存在,也没有关系,只要你有尽快获得数据的计划就好。


  1. 足够的样本:你是否咨询过统计学家或机器学习工程师⁽⁴⁾,你所拥有的数据量是否足够用来学习?


这里说的足够,不是以字节来衡量的,所以要与那些直觉良好的人多聊聊,由他们来操作。


  1. 计算机:你是否有足够的处理能力来处理数据集大小?


对于任何愿意考虑使用云技术的人来说,云技术都是自动的,无需考虑计算机处理能力的问题⁽⁵⁾。


  1. 团队:你是否有信心组件一支具备必要技能的团队?⁽⁶⁾

  2. 真相:除非你使用无监督学习⁽⁷⁾,否则,你是否能够获得输出?


如果不能,你是否愿意支付薪水,雇佣人员为你一遍又一遍地执行任务?


  1. 日志完整性:你是否可以判断哪些输入与哪些输出相匹配?

  2. 日志质量:你是否相信数据集实际上就是其提供者所声称的数据集?


要从样本中学习,你需要质量很好的样本来源。


  1. 无差异曲线:由于你的系统会出错,你是否考虑过一种错误相对于另一种错误更槽糕⁽⁸⁾?

  2. 模拟:你是否考虑过与模拟⁽⁹⁾专家合作,以帮助你将你所要求的的内容进行可视化?


这不是强制性的,但是很有用。


  1. 度量标准创建:你是否将单个输出的得分拼接为多个实例中系统业务性能的度量标准?⁽¹º⁾

  2. 度量评估:你的业务绩效是否经过评估,以确保不会以某种有悖常理和有害的方式⁽¹¹⁾获得良好的得分?

  3. 度量损失比较:(可选)你的业务绩效是否与标准损失函数⁽¹²⁾相关⁽¹³⁾?


如果不相关,你的要求可能会很难达成。


  1. 总体:你是否仔细考虑过你的系统正常工作需要包含哪些实例⁽¹⁴⁾?


被测量的总体⁽¹⁵⁾定义了系统性能测试将涵盖的广泛实例集合。


  1. 最低性能:你是否为测试定义了严格的最低性能标准⁽¹⁶⁾,如果你的系统没有达到这个标准,你就会摧毁这个系统。


如果上面所有的这 22 个问题,你的回答都是 “Yes”,那么,你就可以开始机器学习 / 人工智能的下一步了!这将涉及到数据和硬件(还有工程师)。我很快就会发布后续步骤的指南,敬请期待。


如果你觉得这个极简版的指南不够过瘾,那么启动人工智能项目的完整指南的网址是:http://bit.ly/quaesita_dmguide 你大可以尽情阅读。


[1]: The first step in AI might surprise you


https://hackernoon.com/the-first-step-in-ai-might-surprise-you-cbd17a35708a


[2]: Imagine a drunk island… Advice for finding AI use cases


https://hackernoon.com/imagine-a-drunk-island-advice-for-finding-ai-use-cases-8d47495d4c3f


[3]: What on earth is data science?


https://hackernoon.com/what-on-earth-is-data-science-eb1237d8cb37


[4][6]: Top 10 roles in AI and data science


https://hackernoon.com/top-10-roles-for-your-data-science-team-e7f05d90d961


[5]: Getting Started with Google Cloud Platform


https://cloud.google.com/getting-started/


[7]: Unsupervised learning demystified


https://hackernoon.com/unsupervised-learning-demystified-4060eecedeaf


[8][9][10][11][13][16]: Getting started with AI? Start here!


https://hackernoon.com/the-decision-makers-guide-to-starting-ai-72ee0d7044df


[12]: Machine learning — Is the emperor wearing clothes?


https://hackernoon.com/machine-learning-is-the-emperor-wearing-clothes-59933d12a3cc


[14][15]: Populations — You’re doing it wrong


https://hackernoon.com/populations-youre-doing-it-wrong-820ae76beb95


原文链接:


https://hackernoon.com/ai-reality-checklist-be34e2fdab9

会议推荐

12 月 20-21,AICon将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


2018-11-23 19:141297
用户头像

发布了 375 篇内容, 共 195.7 次阅读, 收获喜欢 947 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

数据分析er看过来,五款工具有你需要的

葡萄城技术团队

数据分析 前端 数据可视化

基于Jmeter的百万级tps性能测试实践

环信

Jmeter 性能测试

【LeetCode】数组元素积的符号Java题解

Albert

算法 LeetCode 11月月更

OpenSergo 流量路由:从场景到标准化的探索

阿里巴巴云原生

阿里云 微服务 云原生

【Redis】Redis AOF持久化

石臻臻的杂货铺

redis 11月月更

聚焦年轻消费人群 百草味入围最受“Z世代”喜爱品牌TOP10

E科讯

以用户为导向,vivo打造安全新范式

极客天地

Docgeni 2.0 发布,开启自动化

PingCode研发中心

实践分享:30分钟在电脑端运行小程序

FN0

桌面应用 桌面应用开发

首批!腾讯云通过金融开源技术服务能力评估

腾源会

开源

鼎茂科技获得阿里云首批产品生态集成认证,携手阿里云共建新合作

阿里巴巴云原生

阿里云 云原生 加速器 企业招募

8分钟带你学会SpringBoot整合Redis来实现缓存技术

好程序员IT教育

redis Spring Boot

RocketMQ 5.0 API 与 SDK 的演进

阿里巴巴云原生

阿里云 RocketMQ 云原生

Spring Boot框架下实现Excel服务端导入导出

葡萄城技术团队

前端 Excel 控件

10 分钟部署一个 API 工具

Scar 

开源 Serverless 接口测试 Vercel

关于Web3.0,你了解多少?个推与您畅聊下一代互联网

个推

互联网 元宇宙 Web3.0

2 分钟,教你用 Serverless 每天给女朋友自动发土味情话

阿里巴巴云原生

阿里云 Serverless 云原生

java企业级开发中常见的注入方式

千锋IT教育

居民消费价格指数变化新鲜出炉,这类商品同比涨幅最大

前嗅大数据

数据分析 数据采集 居民消费 居民消费指数

数字化时代,企业需要怎样的数据中台?报名元年微课堂,一起来探索

元年技术洞察

数据中台

线性稳压电源和开关电源,到底有什么区别?

元器件秋姐

电源电路 元器件采购 元器件电商 元器件知识 华秋商城

vue和react的区别有哪些,哪个好

千锋IT教育

大数据 Hadoop 的五大优势

千锋IT教育

一路同行:开发者与华为云的2022

脑极体

技术解读倚天 ECS 实例——Arm 芯片的 Python-AI 算力优化 | 龙蜥技术

OpenAnolis小助手

Python AI arm ECS sig

10月月更获奖名单出炉啦!快来看看你上榜没有!

InfoQ写作社区官方

热门活动

云原生网关的可观测性体系实践

阿里巴巴云原生

阿里云 云原生 云原生微服务

Kotlin变量的空安全(Null Safety)

子不语Any

android kotlin 11月月更

【倒计时4天】杭州专场-单元测试产品体验样板间,等你加入!

TRaaS

Wallys/Introduction of DR9074 series network card/qcn9074/qcn9072/qcn9024/industrial M.2 card

wallysSK

QCN9074 QCN9024 QCN9072

扒去Spring事件监听机制的外衣,竟然是观察者模式

程序知音

Java spring ssm Java后端 后端技术

如何检查你的项目是不是真的需要用到 AI?_AI&大模型_Cassie Kozyrkov_InfoQ精选文章