写点什么

首个专为半导体行业设计的开源大模型 SemiKong 问世

  • 2024-07-15
    北京
  • 本文字数:1035 字

    阅读完需:约 3 分钟

首个专为半导体行业设计的开源大模型 SemiKong 问世

7 月 10 日,国外初创公司 Aitomatic 宣布推出 SemiKong。这是世界上第一个专为半导体行业设计的开源 AI 大型语言模型(LLM)。它旨在通过将特定领域的知识纳入模型来解决半导体行业面临的一些挑战,例如有关半导体器件和工艺的物理和化学问题。



SemiKong 由人工智能联盟(AI Alliance)成员合作研发。AI 联盟成立于 2023 年,致力于构建、支持和倡导整个 AI 技术领域的开放式创新,包括软件、数据和模型、安全、安保和信任、工具、评估、硬件、教育、开放科学和宣传。


SemiKong 基于联盟成员 Meta 开源的 Llama3 模型,利用了包括 Tokyo Electron 在内的领先半导体公司和 FPT Software 等 AI 专家的专业知识。IBM 研究院 AI 开放创新负责人 Anthony Annunziata 强调,“SemiKong DRAFT v0.6 的诞生表明,汇集不同的专业知识能推动半导体制造等关键行业的重大进步。”


SemiKong 的训练过程主要分为 3 个主要阶段:预训练领域知识——自我微调(指令数据集)——合并和量化。从放出的代码权重,可以看出 SemiKong 有 8B 的参数。它在准确性、相关性和对半导体工艺的理解方面表现出了显著的进步。


Aitomatic 表示,即使是其较小版本,在特定领域的应用中也常常超越较大的通用模型,从而有可能加速整个半导体价值链的创新并降低成本。并且,它也为那些打造适合自身的专有模型的芯片公司提供了一个有价值的基座。



随着 SemiKong 降低半导体生产成本,消费者可以在未来几年内以更低的价格看到功能更强大的智能手机、笔记本电脑和智能家居设备。SemiKong 于 2024 年 7 月 9 日起在 HuggingFace 和 GitHub 上提供下载。下一个更强大的版本计划于 2024 年 12 月推出,预计 2024 年 9 月将推出首批特定工艺型号。


开源地址:https://github.com/aitomatic/semikong


SemiKong 项目的领导者, Aitomatic 首席执行官 Christopher Nguyen 表示:“SemiKong 将重新定义半导体制造业。这种开放式创新模式由人工智能联盟提供支持,利用集体专业知识应对行业特定挑战。在 Aitomatic,我们正在使用 SemiKong 创建领域特定 AI 智能体,以前所未有的效率解决复杂的制造问题。”


Tokyo Electron 高级专家、半导体行业模型的早期提出者 Daisuke Oku 补充道:“SemiKong 是半导体开源 AI 的一个令人激动的开始。Aitomatic 的创新方法有可能为我们的行业带来巨大的飞跃。”


参考链接:


https://www.prnewswire.com/news-releases/aitomatic-unveils-semikong-ai-breakthrough-set-to-reshape-500b-semiconductor-industry-302194215.html


https://www.semikong.ai/


2024-07-15 09:376792

评论 1 条评论

发布
用户头像
这个和RAG的技术路线区别是什么?
2024-07-15 10:38 · 湖北
回复
没有更多了
发现更多内容

☕【JVM性能调优】「CMS垃圾回收器」调优化方案

洛神灬殇

CMS GC jvm调优 6月日更

ServeMux详解

Rayjun

HTTP Go 语言

JSON转Excel

入门小站

工具分享

【架构实战营】第 6 模块作业

swordman

架构实战营

Bzz矿机分币APP,深圳云矿机系统开发

深入浅出 Ajax 的核心原理

悟空聊架构

ajax 架构 大前端 6月日更 悟空聊架构

【Vue2.x 源码学习】第十八篇 - 根据 render 函数,生成 vnode

Brave

源码 vue2 6月日更

架构实战营模块6作业

Vic

架构实战营

【Flutter 专题】100 何为 Flutter Widgets ?

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

架构实战营 - 模块 6- 作业

泄矢的呼啦圈

架构实战营

「SQL数据分析系列」7. 数据生成、转换以及操作

Databri_AI

数据库 sql

Kubernetes手记(15)- dashboard

雪雷

k8s 6月日更

新视界 | 透过鸿蒙OS看手机操作系统

架构精进之路

操作系统 HarmonyOS 6月日更

第六次作业

Geek_9cf7b5

项目经理如何才能不背锅

escray

学习 极客时间 朱赟的技术管理课 6月日更

软件技术从1996年以后就停滞不前了!?难道软件技术难返“春天”了么?

三掌柜

试用期 签约计划 人气作者 TOP10

科技进步道阻且长,仍未来可期

架构精进之路

科技 6月日更

Linux之cd命令

入门小站

Linux

Kubernetes手记(16)- 网络通信

雪雷

6月日更

简单实现springmvc中的请求处理

赵镇

springmvc

微服务的由来

卢卡多多

微服务 6月日更

JavaScript 学习(五)

空城机

JavaScript 大前端 6月日更

网络攻防学习笔记 Day48

穿过生命散发芬芳

网络攻防 6月日更

JAVA面向对象(六)--类和对象

加百利

Java 6月日更

我曾与纪伯伦的对话

卢卡多多

6月日更

Java常用的几个Json库,性能强势对比!

xcbeyond

性能优化 6月日更

Nike上货提醒:监控到商品尺码SKU

木头

Nike监控 上货监控 SKU监控

【21-11】PowerShell文件 IO 操作

耳东@Erdong

PowerShell 6月日更

上云赋智的企业们,也许是这届618的最大赢家

脑极体

自然语言处理技术

Qien Z.

nlp 6月日更

解读SpringBoot和SpringMVC中配置类的@Impot等导入是如何解析的

赵镇

spring

首个专为半导体行业设计的开源大模型 SemiKong 问世_AI&大模型_赵明华_InfoQ精选文章