QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

GitHub 大规模采用机器学习的痛点和破解之道

  • 2020-02-08
  • 本文字数:993 字

    阅读完需:约 3 分钟

GitHub 大规模采用机器学习的痛点和破解之道

ArchSummit 北京 2019 大会上,Jose David Baena 讲师做了《GitHub 大规模采用机器学习的痛点和破解之道》主题演讲,主要内容如下。


演讲简介


Title: Adopting Machine Learning at Scale


Scaling up machine-learning (ML), data retrieval and reasoning algorithms from Artificial Intelligence (AI) for massive datasets is a major technical challenge in our time. The scaling process can also have different dimensions: performance, development productivity, number of employees…


In this talk I will showcase how we used to develop Machine learning features at GitHub, the pain points we had and how we changed our infrastructure and way of development in order to productionize multiple ML features in terms of hours/days.


In addition, I will explore with the audience the main factors I consider when scaling ML at medium to big companies.


By the end of the talk you should have an overview and applicable framework on how to help scaling ML processes in your company.


Talk outline


Potential outline for the talk:


  • Introduction to ML at GitHub.

  • Challenges of running ML at scale. Different dimensions:

  • Performance: number of requests

  • Development: growing infrastructure, number of ML features

  • Organizational: number of employees

  • ML ecosystem architecture.

  • Improving agility and development on ML features.

  • Adopting ML at scale in your company.


讲师介绍


Jose David Baena,GitHub Senior Software Engineer。


Jose David Baena is a Senior Software Engineer at GitHub. He has more than 10 years experience in backend development, from startups to big companies, from Europe to the United States.


His experience ranges from building distributed low latency systems for financial companies to high performant crawlers for social media.


At the moment, he designs architectures that are used by the Machine Learning and Data Science teams at GitHub. He is passionate about distributed systems, machine learning scalability and developer productivity.












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/beijing/schedule


2020-02-08 18:35577

评论

发布
暂无评论
发现更多内容

基于Java+SpringBoot+Vue前后端分离计算机学院校友网设计和实现

hunter_coder

后端开发

霍尼韦尔:AI在工业领域的应用方兴未艾 不断发现新的应用场景

财见

(图片不缺失)深入淘宝商品详情:利用taobao.item_get_desc API挖掘商品标题与描述

代码忍者

API 文档 API 测试 pinduoduo API

macOS Catalina for mac (macos 10.15系统)v10.15.7正式版

Rose

文献解读-遗传病-第二十五期|《通过贝叶斯和单倍型预测胎儿基因型进行单基因病的无创产前诊断》

INSVAST

基因测序 基因数据分析 生信服务 遗传病测序 遗传病

基于Java+SpringBoot+Vue前后端分离家政服务平台设计和实现

hunter_coder

后端开发

基于Java+SpringBoot+Vue前后端分离教师工作量管理系统设计和实现

hunter_coder

后端开发

基于Java+SpringBoot+Vue前后端分离机动车号牌管理系统设计和实现

hunter_coder

后端开发

基于Java+SpringBoot+vue前后端分离技术交流和分享平台设计实现

hunter_coder

后端开发

2024 ChinaJoy,火山引擎以AI大模型为动能推进游戏玩法创新

新消费日报

基于Java+SpringBoot+Vue前后端分离健身房管理系统设计和实现

hunter_coder

后端开发

蝉联“第一”背后,是vivo的“快乐飞轮”正循环

脑极体

终端

Apple Intelligence将在今年10月推出?AI毛绒玩具BubblePal回答人类幼崽十万个为什么!|AI日报

可信AI进展

人工智能

基于Java+SpringBoot+Vue前后端分离教学资料管理系统设计和实现

hunter_coder

后端开发

小间距LED显示屏:引领显示技术新潮流

Dylan

技术优势 LED显示屏 全彩LED显示屏 led显示屏厂家 市场

怎样在touchbar养电子宠物? Touch bar pet for Mac 在macbook上养一只宠物

Rose

MacBook 电子宠物 touchbar

跨平台的SSH、Telnet和SFTP客户端Termius for Mac v8.4.0直装激活版

Rose

Termius for Mac破解

谷歌新AI模型在国际奥数竞赛达到银牌标准!OpenAI推出AI搜索引擎SearchGPT挑战谷歌!|AI日报

可信AI进展

人工智能

基于Java+SpringBoot+Vue前后端分离教师工作量计算系统设计和实现

hunter_coder

后端开发

Autodesk AutoCAD 2024 Mac破解补丁版 cad2024中文安装教程 兼容m芯

Rose

InPlant SCADA笔记 io OPC UA协议的应用

万里无云万里天

工厂运维 OPCUA InPlant SCADA

InPlant SCADA笔记 io S7协议的应用

万里无云万里天

InPlant SCADA 西门子

基于Java+SpringBoot+Vue前后端分离疾病防控综合系统设计和实现

hunter_coder

后端开发

B端常用交互方式的量化及优化实践和指引|得物技术

得物技术

web前端 交互 企业号2024年7月PK榜

JProfiler for Mac(Java开发分析软件) JProfiler

Rose

Java 开发 JProfiler 14下载 JProfiler 14破解版

微服务架构革新:百度Jarvis2.0与云原生技术的力量

百度Geek说

微服务架构 企业号2024年7月PK榜 百度商业产品矩阵 Jarvis应用托管平台

macOS Sonoma 14.6 (23G80) 正式版发布,ISO、IPSW、PKG 下载

sysin

macos Sonoma

GitHub 大规模采用机器学习的痛点和破解之道_ArchSummit_Jose David Baena_InfoQ精选文章