通过使用 AWS,加速了珂晶达应用系统部署的速度。借助自定义 AMI 和 AWS Auto Scaling 技术,使得原来需要 2-3 天的部署时间,在云端只需 2 小时即可完成。”
——苏州珂晶达电子有限公司 总经理 沈忱
关于珂晶达
苏州珂晶达电子有限公司(以下简称“珂晶达”)成立于 2011 年,主要从事科学计算软件设计开发、EDA 软件设计开发、IC 软件设计开发以及相关技术服务,主要产品包括半导体工艺和器件仿真(TCAD)和多物理仿真软件等。目前致力于国产化基础软件研究,公司拥有多个具备自主知识产权的多物理数值仿真软件,涉及热、流体、电磁、电子、辐射等多个技术领域,客户已遍及国内、欧美和亚太区域。
面临的挑战
随着芯片制造工艺的不断发展,芯片的集成化程度越来越高,其性能也越来越强大,大量的计算、验证、仿真工作都需要强大的 IT 资源作为支撑,单靠企业自行构建 IT 资源设备所投入的人力、物力会非常庞大。而且在仿真计算时普遍存在计算周期长、数据量大、耗费资源多的情况,在资源使用上存在前、后期比较集中而中期比较少的问题,导致资源利用率不高。珂晶达希望利用云服务平台实现资源的可配置、可伸缩、以及目标优化。此外,对于珂晶达的很多客户来说,标准的 EDA 软件有些已经不能满足其前沿产品的开发,所以一些标杆客户希望珂晶达能够按照需求进行定制开发。
IGBT 电热耦合仿真平台就是珂晶达重新定义软件的典型案例。珂晶达的客户在研发过程中发现了一些可靠性方面的问题,需要用电热应力、电磁、多物理耦合的仿真来进行分析。在调研了很多国内外成熟软件之后,最终在 2017 年逐步与珂晶达建立合作关系,珂晶达按其需求构建了 IGBT 电热耦合仿真平台。但当珂晶达想要推广通用的 EDA 软件以服务更多客户时,则需要一个部署在云上的 Demo 系统,让更多客户了解和使用。
对于有使用云计算需求的用户来说,平台的运算性能是一个重要的选择标准。在过去,珂晶达的运算系统只是提供内部服务,因为运算量巨大,主要追求在单位时间内完成更多任务。而现在,珂晶达的 IT 系统要面向用户,就不能只考虑任务量和成本,而更加重视云服务的可靠性和弹性,为用户创造优质稳定的工作环境。综合来说,珂晶达希望在云服务的帮助下,支撑业务扩展,为客户提供更为优质稳定的工作环境。在技术考量上,则对服务高可用、弹性伸缩、运维自动化以及安全性保障这些层面比较关注。
为什么选择 AWS
在使用 AWS 之前,珂晶达的 IT 基础架构采用的是自建服务器方式,部分应用云服务的策略。在技术上,珂晶达缺少稳定强大的数据运算系统。最终选择 AWS,也是基于对安全性、稳定性、扩展性、可伸缩性的考量。目前,珂晶达使用的 AWS 服务包括 AWS Auto Scaling 、Elastic Load Balancing(ELB)、 Amazon Simple Storage Service (Amazon S3) 、Amazon Elastic Compute Cloud (Amazon EC2)、 Amazon DynamoDB 等等。
基于 AWS 技术架构,提供 EDA 软件上云新思路
珂晶达基于 AWS 的架构示意图
珂晶达实现 EDA 软件上云的思路,并不是从内网服务器直接迁移到 AWS 云端,而是基于低延迟、高流畅度的标准,重新划分服务器端和浏览器端的计算量分配。通过在 AWS 上部署一个 Slurm 计算集群,由每一个节点领取一个计算任务,进行分布式计算。最终用户直接与基于浏览器的图形界面进行交互。在多用户场景下,通过 ELB 可以把不同用户浏览器发来的请求,分配到不同的 HTTP 服务器上运行的图形界面后端,分别处理不同用户的交互。在这一过程中,AWS 弹性伸缩能力发挥作用,减轻系统压力,为珂晶达的用户带来更好的体验。
在数据存储层面,如仿真结果、仿真波形、IGBT 内部的温度分布等数据量相对较大,主要使用 Amazon S3 来存储;而例如用户的账号信息、配置信息、权限信息、日志等轻量级数据,对延迟要求比较高,主要使用 DynamoDB 来存储,共同保证数据传输、存储与安全。
AWS 解决仿真平台 Demo 快速部署与安全需求
珂晶达非常重视系统的快速部署,通过接入 AWS,可以实现与客户远程协作,只需帮助用户开通平台账户并登录,然后通过线上视频进行协作,就可以短时间内建立试用,省去了过去 IT 工程师实地考察、实地部署的环节。
在安全方面,珂晶达重点考虑目前使用平台 Demo 的用户数据隐私问题。通过使用 AWS,可以很方便地将数据进行清洗,以及为不同的用户账号做数据隔离,进一步提升工作自动化程度。同时 AWS 也不断为珂晶达提供安全性最佳实践经验、配置方法、防火墙设置等建议,为客户安全保驾护航。
统一公司产品线,海内外业务统一接入 AWS
珂晶达在印度有 100+ 家客户,包括学校、商业公司、科研机构等在内,其中超过一半客户是学校。目前其在 AWS 海外区域部署了一套业务系统,以帮助印度高校创建实验环境。在国内业务推广中,珂晶达选择 AWS 的原因之一,也是为了统一公司海内外的产品线。
无论是海外,还是国内的学校客户,都面临 IT 能力薄弱的问题,在使用珂晶达软件的过程当中,经常会碰到一些基础的 IT 问题,为了避免工作人员疲于奔命,珂晶达推动把面向学校和小企业客户的软件升级优化版本,通过统一维护比较成熟的 AWS IT 架构,减轻客户负担,以降低客户支持和 IT 系统维护的成本。
凭借优质技术支持服务,AWS 团队提升客户满意度
在使用 AWS 相关服务时,珂晶达也曾面临过一些细节性的技术问题。例如曾针对服务器 CPU 的配置提出要求,想要在虚拟化的环境里关闭一些影响数值计算性能的 CPU 选项,当时内部查找了一些网上的资料并不能解决他们的问题。在这个过程中,AWS 技术服务团队主动提出一些建议方案,通过线上会议同步设置方法,并指导珂晶达 IT 团队进行测试。在日常合作中,AWS 技术服务团队也随时协助珂晶达解决问题:如何使用某一项新功能、如何合理地配置保证费用最优等等。此外,AWS 在半导体行业拥有专业的服务经验和精深的技术专家,参考 AWS 全球的客户成功经验,帮助珂晶达规划系统应用中长期发展路线,对标国际发展前沿。
沈忱说“经过长期合作和接触,我们认为 AWS 的专业程度非常高。一方面是背后的系统和产品本身的质量很高,另外一方面就是在提供服务支持时,能够提供比较专业的建议,并不是纯粹从商业的角度来看待问题,更多从技术合理性、日后维护总体运营的成本来替我们考虑,我们对此非常满意。”
获得的收益
依托 AWS 高可靠性和弹性等能力,以及在专业技术团队的支持下,珂晶达能够更好地保障业务稳定运行,拓宽市场,获得显著的竞争力改善。一方面,加速了应用系统部署速度,珂晶达借助自定义 AMI 和 AWS Auto Scaling 技术,原来需要 2-3 天时间的部署任务,在云端 2 个小时就能完成。另一方面,节省了运维成本,运维工作量降低了 60%,一个运维人员可以管理更多的 HPC 集群和应用。而且通过弹性伸缩能力既满足高峰期的客户访问流量,也节省了硬件投入。最后,在安全层面,通过AWS Identity and Access Management (IAM)访问控制和Amazon Elastic Block Store (EBS)加密等技术,充分保护了数据安全。
展望未来
在半导体行业升级转型上,EDA 软件或者工业软件上云已然是大势所趋。未来,在 AWS 的助力下,珂晶达将不断提升业务创新水平。同时,随着业务发展对安全性要求的提升,珂晶达也将持续关注 AWS 云安全服务以及新服务的技术跟踪。
为什么使用 AWS
弹性伸缩能力减轻计算压力
快速部署,降低运维成本
保护客户隐私与数据安全
深入业务场景提供专业支持
评论