飞天发布时刻:2024年 Forrester 公有云平台Wave™评估报告解读 了解详情
写点什么

首个专为半导体行业设计的开源大模型 SemiKong 问世

  • 2024-07-15
    北京
  • 本文字数:1035 字

    阅读完需:约 3 分钟

首个专为半导体行业设计的开源大模型 SemiKong 问世

7 月 10 日,国外初创公司 Aitomatic 宣布推出 SemiKong。这是世界上第一个专为半导体行业设计的开源 AI 大型语言模型(LLM)。它旨在通过将特定领域的知识纳入模型来解决半导体行业面临的一些挑战,例如有关半导体器件和工艺的物理和化学问题。



SemiKong 由人工智能联盟(AI Alliance)成员合作研发。AI 联盟成立于 2023 年,致力于构建、支持和倡导整个 AI 技术领域的开放式创新,包括软件、数据和模型、安全、安保和信任、工具、评估、硬件、教育、开放科学和宣传。


SemiKong 基于联盟成员 Meta 开源的 Llama3 模型,利用了包括 Tokyo Electron 在内的领先半导体公司和 FPT Software 等 AI 专家的专业知识。IBM 研究院 AI 开放创新负责人 Anthony Annunziata 强调,“SemiKong DRAFT v0.6 的诞生表明,汇集不同的专业知识能推动半导体制造等关键行业的重大进步。”


SemiKong 的训练过程主要分为 3 个主要阶段:预训练领域知识——自我微调(指令数据集)——合并和量化。从放出的代码权重,可以看出 SemiKong 有 8B 的参数。它在准确性、相关性和对半导体工艺的理解方面表现出了显著的进步。


Aitomatic 表示,即使是其较小版本,在特定领域的应用中也常常超越较大的通用模型,从而有可能加速整个半导体价值链的创新并降低成本。并且,它也为那些打造适合自身的专有模型的芯片公司提供了一个有价值的基座。



随着 SemiKong 降低半导体生产成本,消费者可以在未来几年内以更低的价格看到功能更强大的智能手机、笔记本电脑和智能家居设备。SemiKong 于 2024 年 7 月 9 日起在 HuggingFace 和 GitHub 上提供下载。下一个更强大的版本计划于 2024 年 12 月推出,预计 2024 年 9 月将推出首批特定工艺型号。


开源地址:https://github.com/aitomatic/semikong


SemiKong 项目的领导者, Aitomatic 首席执行官 Christopher Nguyen 表示:“SemiKong 将重新定义半导体制造业。这种开放式创新模式由人工智能联盟提供支持,利用集体专业知识应对行业特定挑战。在 Aitomatic,我们正在使用 SemiKong 创建领域特定 AI 智能体,以前所未有的效率解决复杂的制造问题。”


Tokyo Electron 高级专家、半导体行业模型的早期提出者 Daisuke Oku 补充道:“SemiKong 是半导体开源 AI 的一个令人激动的开始。Aitomatic 的创新方法有可能为我们的行业带来巨大的飞跃。”


参考链接:


https://www.prnewswire.com/news-releases/aitomatic-unveils-semikong-ai-breakthrough-set-to-reshape-500b-semiconductor-industry-302194215.html


https://www.semikong.ai/


2024-07-15 09:377223

评论 1 条评论

发布
用户头像
这个和RAG的技术路线区别是什么?
2024-07-15 10:38 · 湖北
回复
没有更多了
发现更多内容

AliRTC 开启视频互动 “零计算” 时代

阿里云CloudImagine

阿里云 音视频 RTC 视频云

程序员:我熟悉多线程!面试官:都不敢写精通,还敢要26K?

Java 编程 程序员 面试 多线程

使用 Spring Boot 构建可重用的模拟模块

码语者

Spring Boot Module

龙蜥操作系统将捐赠开放原子开源基金会

OpenAnolis小助手

Linux centos 开源社区 开放原子开源基金会

基于 RocketMQ 构建阿里云事件驱动引擎EventBridge

阿里巴巴中间件

阿里云 RocketMQ 云原生 中间件 事件总线

7张图揭晓RocketMQ存储设计的精髓

阿里巴巴中间件

阿里云 技术 RocketMQ 中间件 存储

GitHub标星139K的:“嵌入式Linux系统开发教程”

Java Linux 编程 程序员

Linux踩过的坑

正向成长

Linux

并发编程之深入理解CAS

Fox爱分享

CAS 并发’ 11月日更 比较与交换

如何使用注解优雅的记录操作日志 | 萌新写开源 01

Zhendong

Java GitHub

全面升级 —— Apache RocketMQ 5.0 SDK 的新面貌

阿里巴巴中间件

云计算 阿里云 RocketMQ 云原生 中间件

巩固Java基础,备战来年跳槽——你的薪资自己说了算

Java 编程 程序员 面试 线程

阿里云性能测试服务PTS新面貌 - 压测协议、施压能力全新升级

阿里巴巴中间件

阿里云 中间件 性能测试 SaaS 压测

golang源码学习--context

en

Context

茜纱窗下夜读书(2021年11月)

美月

#读书

【应用分享】百度超级链助力CFCA建设基于区块链的电子数据存证系统

百度开发者中心

百度 超级链

用户案例|告别传统金融消息架构:Apache Pulsar 在平安证券的实践

Apache Pulsar

Apache Pulsar

资产管理系统是管钱的吗?不完全对

低代码小观

企业管理 资产配置 资产管理 管理系统 企业资产

JWT、JWS与JWE

喵叔

11月日更

又碰到一个奇葩的BUG

艾小仙

GitHub多次霸榜,两个月拿下10000+Star,不愧是阿里内部开源的SpringCloud Alibaba笔记

Sakura

Java 编程 架构 面试 计算机

Python代码阅读(第54篇):斐波那契数列

Felix

Python 编程 斐波那契 阅读代码 Python初学者

300M的文件,9秒钟下载完成,这款软件真的太离谱!

懒得勤快

浅谈DNS递归解析和迭代解析之间的区别

喀拉峻

网络安全

模块二作业

ks

RecyclerView使用GridLayoutManager为什么无法均匀分布?

Changing Lin

11月日更

如何用 Flutter开发一个直播应用

声网

flutter 人工智能

如何给企业制定碳排放额度?

石云升

学习笔记 碳中和 11月日更 碳交易

优酷小程序优化实战

阿里巴巴终端技术

小程序 ios android 客户端 包大小

客户端稳定性异常检测:函数接口“扫雷”实践

阿里巴巴终端技术

函数式接口 稳定性测试 异常检测 客户端 APP稳定性

专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%

阿里巴巴中间件

阿里云 微服务 云原生 中间件 Eureka

首个专为半导体行业设计的开源大模型 SemiKong 问世_AI&大模型_赵明华_InfoQ精选文章