写点什么

BenchSci 通过 Google Cloud 帮助制药公司交付新药

  • 2021-03-25
  • 本文字数:1525 字

    阅读完需:约 5 分钟

BenchSci 通过 Google Cloud 帮助制药公司交付新药

每个初创企业都应该有一个崇高的目标,即使他们不能 100%地确定自己将如何实现目标。我们的公司 BenchSci 是一家加拿大生物技术初创公司,其使命是帮助科学家将新药研发速度提高 50%。自 2015 年公司成立以来,我们在建立一个平台,以帮助科学家通过挖掘和开发新药大量公共数据集,研究文章和专有客户数据集。该平台完全建立在 Google Cloud 之上,Google Cloud 为医疗技术提供功能的广度和深度为我们朝着目标迈进提供了支持。

 

由于制药研发效率低下,因此我们的任务迫在眉睫。以临床前研究为例:一项研究估计临床前研究支出的一半是浪费的,仅在美国每年就达到 282 亿美金,在全球达到 486 亿美金。根据我们的估计,大约 36.1%的临床前研究浪费来自科学家,他们使用了不适当的试剂,诸如生命科学实验中使用的抗体之类的材料。

 

因此,我们的第一款产品是 AI 辅助试剂选择工具。它收集相关的科学论文和试剂目录,使用专有的机器学习模型从中提取相关的数据点,使结果以易于使用的界面搜索方式提供。根据现有的实验证据,科学家们可以快速地预先确定一种特定的试剂是否适合他们的实验。这样,他们可以将精力集中在最有可能产生成果的实验上,并更快地为患者提供新的治疗方法。

 

所有这些都在 Google Cloud 上运行。我们收集论文和文章、产品目录、医学和生物学数据库以及其他数据,并将它们存储在 Cloud Storage 中。然后,我们使用 Dataflow 、BigQuery 和其他工具构建的管道来组织和提取数据的见解。接下来,我们使用机器学习算法处理数据,并将结果存储在 Cloud SQL 和 Cloud Storage 中。科学家们通过基于 Google Kubernetes Engine( GKE ), Cloud Load Balancer ,身份识别代理, Cloud CDN , Cloud DNS 和其他服务的 Web 界面访问结果。最后,我们使用多个云项目,IAM 和 Infrastructure-as-code (基础架构即代码)来确保数据安全和隔离每个客户。除了最专业的研发架构和操作之外,我们不再需要其他东西,从而大大减少了管理费用。

 

Google Cloud 托管服务与易于扩展的持久性容器和虚机的结合,使我们能够快速对新功能进行原型设计和测试,然后以最少的管理工作将它们投入生产。

 

Google Cloud 还可以根据 BenchSci 的需求进行扩展。例如,过去三年来,我们分析的数据增加了一个数量级。切换到 BigQuery (无服务器数据仓库)和 Cloud SQL (托管的关系型数据库)消除了我们的大量运营开销,还要感谢 BigQuery 在文本处理机器学习管道中设置关键步骤的灵活性以及 Cloud SQL 在数据访问方面的稳定性。

 

随着时间的推移,我们还改进了数据处理流程。我们从 Dataproc (托管的 Hadoop 服务)开始,后来利用 Dataflow (使用 Apache Beam )重写了该系统。数据流可以处理数百 TB 的数据,让我们专注于实现业务逻辑,而不是管理基础架构。

 

最近,我们扩展了平台以支持私有数据集。最初,我们为所有客户提供对同一基础公共数据的不同视图。但是,随着时间的推移,一些客户问我们是否可以在系统中包括他们专有的药理数据。我们没有使用严格的项目隔离来管理多租户系统,而是利用 GKE 和 Config Connector 为每个客户的数据创建独有的环境,而不会增加团队的运维工作量。

 

简而言之,Google Cloud 使我们能够专注于解决问题,而不必因构建和运营计算基础架构和服务而分心。展望未来,在 Google Cloud 上运营使我们有信心通过收集更多和更广泛的数据源来成长;使用机器学习算法从每个数据单元中提取更多信息;处理更广泛,更专有的数据;通过各种接口和访问点来满足更广泛的客户需求。我们的目标仍然雄心勃勃,但是通过与 Google Cloud 合作,感觉可以实现。

 

在 Google Cloud 上的知名医疗客户包括了罗氏、拜耳、赛诺菲、薛定谔等。

 

了解有关医疗保健和生命科学解决方案的更多信息

2021-03-25 17:531029

评论

发布
暂无评论
发现更多内容

性能压测

jorden wang

讲述我在阿里六面的经历,幸好我掌握了这份“Java并发编程+面试题库”成功拿到20K的offer

比伯

Java 编程 架构 面试 计算机

mysql的这些坑你踩过吗?快来看看怎么优化mysql?

比伯

Java 编程 架构 面试 计算机

线程池的优点及其原理,代码实现线程池。简单、明了。

Linux服务器开发

后端 网络编程 线程池 Linux服务器 web服务器

ONES 收购知名协作工具 Tower

万事ONES

团队协作 高效 研发管理工具 收购 资讯

训练营第七周作业

大脸猫

极客大学架构师训练营

价值、产业、数据加密,区块链如何助力互联网升级?

CECBC

区块链 互联网

区块链产业下的“非遗”突围战:商业化和手艺人发掘

CECBC

区块链 非遗

训练营第七周总结

大脸猫

极客大学架构师训练营

看区块链如何打通信息壁垒,盘活万亿级”积分”市场

CECBC

区块链 信息

想了解任务型对话机器人,我们先从自然语言理解聊起

华为云开发者联盟

人工智能 机器人 自然语言

程序员的故事

Philips

敏捷开发 快速开发 原创小说 企业开发 企业应用

我在阿里巴巴做 Serverless 云研发平台

阿里巴巴云原生

Serverless 容器 开发者 云原生 CloudNative

每周学点TARS——服务自定义命令

TARS基金会

c++ DevOps 后端 TARS

接口测试怎么进行,如何做好接口测试

测试人生路

软件测试 接口测试

一个真正0基础小白学习前端开发的心路历程

华为云开发者联盟

开发 开发小白 0基础

挑战赛 | 话题王者VS互动先锋(第一季)

InfoQ写作社区官方

话题讨论 热门活动

已拿腾讯后台开发岗offer,简单说下自己的面试经历和学习路线

程序员小灰

c++ 后台开发 架构师 TCP/IP Linux服务器开发

《迅雷链精品课》第十课:共识算法理论基础

迅雷链

区块链

腾讯大牛整合Java+spring5系统学习架构,神乎其技

小Q

Java 学习 编程 面试 spring 5

给你一个亿的keys,Redis如何统计?

不才陈某

redis

新闻|Babelfish使PostgreSQL直接兼容SQL Server应用程序

PostgreSQLChina

数据库 postgresql 开源

架构师训练营第二周框架设计课后练习

Geek_xq

年轻人想详细了解做了十年Linux跟做了十年Windows的程序员差距有多大吗?听我慢慢道来!

ShenDu_Linux

Linux 程序员 windows

ONES 收购 Tower,五源资本合伙人对话两位创始人

万事ONES

项目管理 团队协作 ONES Tower 收购

「更高更快更稳」,看阿里巴巴如何修炼容器服务「内外功」

阿里巴巴云原生

容器 运维 云原生 双十一 CloudNative

打造Django私有化缓存组件django-api-cache

pygodnet

django django-api-cache django缓存 私有化缓存 接口缓存

技巧收藏|10个JavaScript常用数组操作方法

华为云开发者联盟

Java 数组 开发

《前端实战总结》之使用CSS3实现酷炫的3D旋转透视

徐小夕

css3 大前端 CSS小技巧

架构师训练营 1 期 -- 第十一周总结

曾彪彪

极客大学架构师训练营

即使不会node.js,拖拽就可完成数据的可视化展示

华为云开发者联盟

node.js 数据 可视化

BenchSci 通过 Google Cloud 帮助制药公司交付新药_数据库_Google Cloud_InfoQ精选文章