写点什么
极客说|Phi-4 模型的 4 位量化与 vLLM 高速推理
极客说|Phi-4 模型的 4 位量化与 vLLM 高速推理

的模型参数量是 14B,这使它在推理的时候比较耗费内存。因此如果我们想要在边缘端运行,需要对它进行量化。

开源云原生数据仓库 ByConity实测,开启开启数据仓库的新篇章
开源云原生数据仓库 ByConity 实测,开启开启数据仓库的新篇章

通过合理调整 distributed_max_parallel_size 和 max_memory_usage 的值,用户可以在保证查询性能的同时,避免资源过度消耗和查询失败的风险。ByConity 非常推荐,原生数据仓库搭建,ByConity 你值得拥有。

重磅!云器数据平台即日起免费开放,通用增量计算引擎首次面向全行业试用
重磅!云器数据平台即日起免费开放,通用增量计算引擎首次面向全行业试用

2025 年 1 月 15 日,云器科技举行了云器 Lakehouse 产品开放注册发布会。这标志着这家专注于数据基础设施的科技公司,正式向全球用户开放体验其创新的云湖仓产品。

向每年服务超过 10 亿人次的系统“发难”,麦当劳的混沌工程实践
向每年服务超过 10 亿人次的系统“发难”,麦当劳的混沌工程实践

主动向每年服务超过 10 亿人次的系统“发难”,已经成为麦当劳 IT 团队的日常。而在整个混沌工程实践历程中,这家坐拥数千家门店的餐饮界巨擘,也完成了将 IT 系统从能用好用到更稳定可靠的转变。

成为 Functionless:如何培养无服务器思维以减少代码编写!
成为 Functionless:如何培养无服务器思维以减少代码编写!

文章指出无服务器技术构建应用并非只靠函数,过度使用会致架构混乱。介绍了 FaaS 副作用,如 Lambda 锤子思维、弹球架构、成本增加等。还阐述如何培养无函数思维,包括利用生态系统、处理数据等方面,同时提及 Functionless 的权衡,旨在帮助开发者简化架构。

深入了解 ByConity的BSP模式:云原生数据仓库的创新实践
深入了解 ByConity 的 BSP 模式:云原生数据仓库的创新实践

ByConity 的设计理念是简化联邦查询的复杂性,通过开源的方式提供一个灵活、高效的解决方案。同时,它与现有的开源大数据生态系统(如 Apache Arrow、Apache Iceberg)紧密集成,增强了其易用性和扩展性

Apache Doris 创始人:何为“现代化”的数据仓库?
Apache Doris 创始人:何为“现代化”的数据仓库?

Apache Doris 目前 GitHub Stars 已近 13,000,社区的贡献者达到近 670 名,平均每月活跃贡献者超过 120 名。这一成就使其超越了 Spark、Kafka 等项目。

RAG 的未来,走向繁荣、重塑还是消亡?
RAG 的未来,走向繁荣、重塑还是消亡?

百度灵医大模型底座技术负责人夏源、Hugging Face Machine Learning Engineer 尹一峰、火山引擎技术专家田昕晖、阿里云高级技术专家费跃,共同探讨 RAG 技术在不同领域中的应用维度。

从 Linux 内核隔离到 Java 透明协程,快手系统软件技术架构演进之路
从 Linux 内核隔离到 Java 透明协程,快手系统软件技术架构演进之路

系统软件作为软件架构的基石,发挥着承上启下的关键作用。快手系统软件团队经过四年的探索与实践,成功积累了一系列创新技术与性能优化方法论,这些成果广泛涵盖 Java 协程、编译器优化、操作系统改进等多个关键领域。

对 OpenAI 故障的思考|如何让 Kubernetes 更稳定?
对 OpenAI 故障的思考|如何让 Kubernetes 更稳定?

Kubernetes 已成为云原生时代的重要基础设施,管理庞大复杂的基础设施从来都不是一件容易的事情。

AI 信创与湖仓一体化,2024 年数据库&湖仓发展与展望
AI 信创与湖仓一体化,2024 年数据库 & 湖仓发展与展望

展望未来,我意识到,尽管数据库行业正面临明显的瓶颈,湖仓领域却蕴藏着无尽的潜力,而 AI 的崛起将进一步提高从业门槛。

Apache Iceberg 赢得未来:2025 年如何前进
Apache Iceberg 赢得未来:2025 年如何前进

数据工程的未来已经到来,而它正是 Iceberg。

跟UML创始人、IBM院士Grady Booch聊软件工程50年演变:从传统编码到大模型时代
跟 UML 创始人、IBM 院士 Grady Booch 聊软件工程 50 年演变:从传统编码到大模型时代

整个软件工程的发展史,就是一段抽象层次不断提升的历史。我们如今正在见证又一个抽象层次的出现,它为我们带来了极其强大的框架,帮助我们以此为基础构建新的系统。

微软Copilot从PWA转向“原生”,内存占用却飙升至1GB
微软 Copilot 从 PWA 转向“原生”,内存占用却飙升至 1GB

这真的是“原生”吗?

苹果也监听?一群人打了5年官司赢近7亿赔偿,但用户连200块都拿不到?
苹果也监听?一群人打了 5 年官司赢近 7 亿赔偿,但用户连 200 块都拿不到?

1 月 3 日的一则消息引发关注:苹果因涉嫌录制用户对话并用于定向广告,与用户达成和解,同意赔偿 9500 万美元(约 7 亿人民币)。

薪资天花板语言Zig出神作!HashiCorp大神新作刷屏编程圈,Redis之父直呼真香!
薪资天花板语言 Zig 出神作!HashiCorp 大神新作刷屏编程圈,Redis 之父直呼真香!

Redis 之父 antirez:通常情况下,终端会成为瓶颈,但这个工具却能在瞬间打印出 50 万条结果。

一次App更新失败,CEO不得不辞职谢罪:技术重构导致用户纷纷将数千元高科技产品丢进垃圾堆
一次 App 更新失败,CEO 不得不辞职谢罪:技术重构导致用户纷纷将数千元高科技产品丢进垃圾堆

送走销售型 CEO,转而让有技术和产品背景的人来负责这款高科技产品,这个决策本身也让很多网友拍手称快,认为这才是公司应该做的选择。

CIKM 2024 | 京东电商搜索:深度强化学习的探索与落地
CIKM 2024 | 京东电商搜索:深度强化学习的探索与落地

在京东零售这样的电商平台上,搜索领域是最大的流量场域,承担着提升自然流量可运营能力的重要任务。如何通过有效的流量调控系统来增强商家对自然流量的运营能力,成为平台和商家共同关注的焦点。

2024 京东零售技术年度总结
2024 京东零售技术年度总结

每一次回望,都为了更好地前行。

中国软件重塑的关键一年:这11大领域迎来了自己的“ChatGPT时刻” | 年终盘点
中国软件重塑的关键一年:这 11 大领域迎来了自己的“ChatGPT 时刻” | 年终盘点

大模型只投入也没杀手级应用,2025 年你跟吗?国内开源社区所存在独特问题:部分开源、放收款码,专家们怎么评价?Rust 火得像邪教,明年我们学不?你是否处于我们盘点的这 11 大领域之中,是否错过了最大风口?......InfoQ 一年一度的盘点,不仅是一份行业指南,更是一份对未来趋势的预测。

大模型搜广推,“新瓶装旧酒;还是“范式的革新”?
大模型搜广推,“新瓶装旧酒;还是“范式的革新”?

百度主任架构师、信息流推荐架构负责人颜林担任主持人,与百度资深工程师施刘远、京东算法总监张泽华、枫清科技(Fabarta)AI 负责人张红兵、火山引擎边缘智能技术负责人谢皓,共同探讨大模型技术在应用架构中的创新与实践。

ByConity :深入探讨ELT和bsp 模式应用实例
ByConity :深入探讨 ELT 和 bsp 模式应用实例

ByConity 是一个先进的数据集成与处理平台,专注于提供高效、灵活的 ELT(Extract, Load, Transform) 能力。它致力于通过简化数据管道设计和优化数据处理流程,帮助企业应对复杂的大数据处理需求,实现更快的数据传输速度、更高的处理能力以及更低的运维成本。

Flutter 3.27发布,Impeller 成为默认渲染引擎,改进 iOS 和 Material 小部件
Flutter 3.27 发布,Impeller 成为默认渲染引擎,改进 iOS 和 Material 小部件

Flutter 3.27 发布,有诸多新特性与改进。如 Cupertino 小部件更贴合苹果 UI 指南,Material 小部件的 CarouselView 等得到优化,ModalRoutes 等功能增强。Impeller 成为默认渲染引擎,性能提升且调试支持改善,还增强了对工具和并发的支持,另有 iOS 渲染性能等方面的进步。

ByConity ELT实战:云原生数据仓库的高效数据处理与性能优化探索
ByConity ELT 实战:云原生数据仓库的高效数据处理与性能优化探索

随着大数据技术的发展,实时数据仓库和离线数据仓库在企业数据分析中的重要性日益增加。为了满足企业对数据处理性能和效率的多样化需求,ByConity 作为一款开源云原生数据仓库,提供了一个高效的解决方案,特别是在 ELT(Extract, Load, Transform) 任务的执

Java 近期新闻:GlassFish、Spring AI MCP、Grails、Helidon、JReleaser、Resilience4j、Arquillian
Java 近期新闻:GlassFish、Spring AI MCP、Grails、Helidon、JReleaser、Resilience4j、Arquillian

以来的更新,有对各种问题的修复。有关此版本的更多细节,请参阅发行说明。以来的更新,有对各种问题的修复。

大模型多云部署怎么玩?阿里创作平台 MuseAI 集团内外落地指南
大模型多云部署怎么玩?阿里创作平台 MuseAI 集团内外落地指南

本文以阿里真实使用场景出发,分享 MuseAI 多云部署架构实践。

科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗
科大讯飞发布首个基于全国产算力的深度推理大模型 X1,率先落地教育、医疗

科大讯飞与华为合作攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等难题。