写点什么

ATEC“数星”计划发布,开源亿级工业数据集

  • 2023-09-08
    北京
  • 本文字数:575 字

    阅读完需:约 2 分钟

ATEC“数星”计划发布,开源亿级工业数据集

9 月 8 日,在上海举行的 2023 inclusion·外滩大会《从机器智能到人机智能》论坛上,ATEC 前沿科技探索社区宣布启动 ATEC“数星”计划。


这是业内首个基于真实工业场景的大规模研究性数据集开放计划首批将公开两个脱敏的、超大规模的工业数据集——ATEC2022 赛事数据集“农村金融风险预测”和蚂蚁集团多场景多模态点击率预估数据集(AntM2C)


目前,“数星”计划的数据集可在ATEC官方平台下载。


“农村金融风险预测”中包含了涉农经营者的信贷风险信息及用户的历史多源交互数据。如何利用数字化技术识别农村经营者的经营状况和经营风险,是帮助农村经营者进行融资的基础能力之一。该数据集在遵循国家法律法规及个人隐私保护的前提下,为金融科技领域、特别是农村金融科技领域的行业研究和发展提供了重要的数据支持。


AntM2C 覆盖支付宝内多个业务场景,包含广告、营销、搜索和推荐真实场景中不同类型商品的 CTR 数据,整体数据规模达到 10 亿(第一阶段发布 1700 万规模的数据)。该数据集的发布填补了行业内,多场景多模态点击率预估问题的数据集空白。


清华大学计算机系副系主任、ATEC 前沿科技探索社区发起人徐恪教授指出,“数星”计划是 ATEC 社区在科技赛事、高校实训之后的又一项重要举措。数字技术的研究和发展离不开真实应用的数据土壤,亿级规模工业数据集,将成为人机智能等创新技术的关键燃料,推动机器智能等新一代数字技术的新范式发展。

2023-09-08 15:182888

评论

发布
暂无评论
发现更多内容

华为技术专家出品,《华为开发者空间案例指南》带你玩转云上20+场景应用开发

华为云开发者联盟

#Serverless 鲲鹏计算 AI 基础设施

AI集成效率提升:10大最佳机器学习API

幂简集成

机器学习 API

如何做到供给侧管理与需求侧管理有机结合

易成研发中心

需求管理 需求管理工具

改变仿真游戏规则,Altair的AI与HPC技术创新仿真之路

Altair RapidMiner

数据分析 仿真 CAE #人工智能 altair

Supersonic 平台上线Top Creatives Library 功能,为手游开发者打造广告投放素材库

Geek_2d6073

基于事件驱动构建 AI 原生应用

阿里巴巴云原生

阿里云 云原生

观测云集成 Lark SSO 最佳实践

观测云

SSO

解读TinyEngine低代码引擎2.0,如何改变前端二次开发模式

华为云开发者联盟

低代码 #开源 OpenTiny TinyEngine AI 基础设施

人事人才信息管理系统:2024年10大推荐系统

易成研发中心

YashanDB 开机自启

YashanDB

数据库 yashandb 崖山数据库 开机自启

初入一个新的项目领域,要如何快速理清思路

爱吃小舅的鱼

项目管理

【连载 03】Java 线程池(上)

FunTester

Spring AI Alibaba 配置管理,用 Nacos 就够了

阿里巴巴云原生

阿里云 云原生

首个被人类骗钱的 AI 诞生;微信公众号后台新增「AI 配图」功能丨 RTE 开发者日报

声网

纯血鸿蒙进程加速,混合app开发迎来又一波新机会

FinFish

混合应用开发 跨端开发 鸿蒙应用开发 纯血鸿蒙 混合app开发

如何做好团队文档管理

易成研发中心

文档管理 文档管理软件

从开发者工具转型 AI 呼叫中心,这家 Voice Agent 公司已服务 100+客户

声网

通义灵码融入南京大学 AI 编程创新课,与高校数字化创新人才培养同行

阿里云云效

阿里云 云原生

百度副总裁陈洋:开发全流程进入智能体时代,又快又好又安全

百度安全

英特尔打造企业AI一体化方案,贯穿客户需求源头和终点

E科讯

通义灵码融入南京大学 AI 编程创新课,与高校数字化创新人才培养同行

阿里巴巴云原生

阿里云 云原生

他们用AI,为另外一群人做了双“眼睛”

华为云开发者联盟

modelarts 开发板 昇思MindSpore AI 基础设施

为什么现在Java面试越来越难了?

了不起的程序猿

程序员 微服务 高并发 java面试 八股文

AI宠物APP开发的主要功能

北京木奇移动技术有限公司

AI应用 AI智能体 AI宠物

如何阅读Spring源码?

开心学Java

Java 面试 后端 架构师 spring源码

浅谈YashanDB三权分立

YashanDB

数据库 yashandb 崖山数据库 三权分立

零代码构建AI Agent,解读华为云AI原生应用引擎的架构与实践

华为云开发者联盟

大模型 AIGC AI Agent AI 基础设施

在华为开发者空间,基于鲲鹏服务器快速开发打砖块小游戏

华为云开发者联盟

服务器 鲲鹏云 web 开发

定制化NFT链游DAPP开发:一站式解决方案助力游戏创新

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

企业如何挑选OKR目标管理软件?9款工具功能全面分析

易成研发中心

揭秘UGO SQL审核功能4大特性,让业务平滑迁移至GaussDB

华为云开发者联盟

GaussDB UGO SQL审核 #SQL

ATEC“数星”计划发布,开源亿级工业数据集_工业_蚂蚁集团_InfoQ精选文章