写点什么

七年没能将 Python 集成到 Excel,Python 之父加入微软三年后成了!

  • 2023-08-25
    北京
  • 本文字数:3834 字

    阅读完需:约 13 分钟

七年没能将Python 集成到 Excel,Python 之父加入微软三年后成了!

近日,微软宣布将流行的编程语言 Python 引入到了 Excel。该功能的公共预览版现已推出,允许 Excel 用户操作和分析来自 Python 的数据。

 

微软表示,Python in Excel 能够在同一工作簿中将 Python 与 Excel 分析原生组合起来,无需任何额外设置。使用 Python in Excel,用户可以直接在单元格内键入 Python,相关计算将在微软云端运行,并将绘图和可视化等结果返回至工作表内。

 

“听起来像愚人节玩笑,但这是真的!”“太棒了!它肯定可以加快我的工作速度。”网友们听到这个消息后纷纷发出了感叹。为什么大家都对此感到兴奋呢?我们先看下 Python 的强大功能和 Excel 的灵活性结合后,都发生了哪些“化学反应”?

 

Python in Excel 有何独特之处?

 

Python in Excel 即将通过 Excel for Windows 的 Beta Channel,向 Microsoft 365 Insiders 项目的会员们发布公共预览版。不过微软也表示在预览结束后,“如果没有付费许可证,某些功能将受到限制”。

 

首先,Python in Excel 专为分析师而构建。微软表示,每一天,全球各地都有数百万用户依靠熟悉的 Excel 工具(例如公式、图表和数据透视表)分析并理解自己的数据。Python in Excel 将以原生方式被直接整合至 Excel 网格当中。

 

用户只需使用新的 PY 函数即可将 Python 代码直接输入至 Excel 单元格中。Excel 用户可通过 Python 访问强大的分析功能,从而实现可视化、数据清洗、机器学习和预测分析等目标。用户现在可以创建起无缝对接的 Excel 加 Python 端到端解决方案,且全程无需脱离于 Excel 之外。使用 Excel 的内置连接器加 Power Query,用户还能轻松将外部数据引入 Python in Excel 的工作流程。Python in Excel 还跟用户所熟悉并喜爱的各种工具相兼容,例如公式、数据透视表和 Excel 图表等。下面来看 Python in Excel 所能实现的几种分析示例:

 

  • 高级可视化

 

充分利用 Matplotlib 和 seaborn 等著名 Python 图表库的功能构建各类图表,包括传统的条形图、线形图,乃至热力图、小提琴图和群图等专用可视化效果。

 


 使用 Seaborn 生成的各种图

 

  • 机器学习、预测分析和预期计算

 

利用 scikit-learn 与 statsmodels 等 Python 库,可以实现目前人气极高的机器学习、预测分析与预期计算,包括回归分析、时间序列建模等等。

 


使用 Python 和 Excel LAMBDA 构建的天气预测机器学习模型

 

  • 数据清洗

 

可有效利用先进的数据清洗技术,例如查找缺失值、标准化格式、删除重复项,并可采用正则表达式等技术进行基于模式的转换。

 


 使用正则表达式提取日期

 

其次,Python in Excel 通过 Anaconda 实现顶级 Python 分析功能。

 

Anaconda 是全球数千万数据从业者日常使用的领先 Python 项目。Python in Excel 可使用运行在 Azure 当中的 Anaconda Distribution for Python,其中包含最流行的各 Python 库(例如 pandas、Matplotlib、scikit-learn 等),并由 Anaconda 安全完成构建、测试和支持。Anaconda 提供的 Python 功能,支持在 Python in Excel 中执行广泛的分析操作。

 

再者,Python in Excel 运行于微软云端,无需任何额外设置。

 

Excel 使用的 Python 代码运行在微软云端,并提供 Microsoft 365 兼容的连接体验。Python 代码使用 Azure 容器实例在自己的虚拟机管理程序内隔离运行,并通过安全的软件供应链从 Anaconda 处获取源构建包。微软表示,Python in Excel 可以防止运行的 Python 代码知晓用户身份,通过互联网打开的工作簿也在独立的容器内受进一步隔离,这就妥善保护了用户的数据隐私。工作簿中的数据只能通过内置 xl() Python 函数发送,且 Python 代码的输出只能作为=PY() Excel 函数的结果返回。

 

另外,Python in Excel 专为团队协作而打造。

 

用户可以在 Excel 工作簿内共享 Python。各团队成员还可以在基于 Excel 的分析中无缝进行 Python 交互并刷新,不必分神安装其他工具、Python 运行时,或者管理库和依赖项。用户可以随意选择自己喜爱的协作工作(例如 Microsoft Teams 和 Microsoft Outlook)来共享工作簿,并通过评论、@提及还有与同事共同开发以进行无缝协作,整个体验过程与本地 Excel 无异。包含 Python 的工作簿还配合有敏感度标签,能够确保其符合组织内的信息保护策略。

 

Excel 团队曾尝试过,但失败了

 

该消息发布后,自称曾在 Excel 工作过的开发者“vba”爆料,Excel 早就试着将 Python 引入 Excel,但最终失败了。

 

作为一个曾试图将 Python 引入 Excel 的前 Excel 开发人员,今天看到这个消息真的很惊喜。7 年多前,我选择离开 Excel 团队。当时老板的老板知道我对将 Python 引入 Excel 很感兴趣,如果我选择留下的话,就给我一个机会来解决这个问题。后来,原本 6 个月的项目变成了大约 3 年的项目,Python 的部分消失了,我们最终在 Excel 中启用了 JavaScript 自定义函数。

 

对于 Python,我们当时也是设计为在“云端”(AzureML v1)运行,尽管就是否应该在本地运行上前前后后做了很多讨论。我认为让 Python 部分消失的是我们的合作伙伴 AzureML 团队的重新重组、重新发布和重新雇佣,我们失去了一个 PM。与此同时,我们的工作引起了另一个合作伙伴团队的注意,他们意识到他们可以使用我们的代码来执行进程外的 JavaScript。所以我花了很多时间来确保功能成功发布,我想这对 Python 是不利的。

 

我得到了一些优秀工程师的帮助,也学到了很多东西。这项工作的核心是修改 Excel 的计算引擎,使其允许函数异步计算,允许用户在远程终端(JavaScript、Python 或其他工具)计算的同时继续处理电子表格的其他部分。以前,电子表格会在计算运行时被锁住,这对于长时间运行的无限计算来说不太友好。不知道我们当时构建的任何功能是否都被纳入了这项新功能。

 

现在,非常高兴看到这个功能,并期待去尝试。

 

微软表示,Python in Excel 的诞生,源自微软内部多个团队之间的密切合作,包括微软 Excel、微软开发者部门、微软安全部门、微软 Azure 以及微软研究院等。其中,Python 创建者、BDFL 荣誉退休人员、现任 Microsoft 杰出工程师 Guido van Rossum 也参与了这项工作,并帮助定义了 Excel 中的 Python 架构。

 

“我很高兴 Python 和 Excel 的这种出色的、紧密的集成现在已经面世。我希望两个社区都能在这次合作中找到有趣的新用途,从而增强每个合作伙伴的能力。三年前我加入 Microsoft 时,我做梦也没想到这会成为可能。Excel 团队非常出色!”Rossum 表示。

 

Rossum 如今已经 67 岁。2020 年 11 月,耐不住无聊退休生活的 Rossum 决定加入微软的开发者部门。当时,微软组建了一个团队来提高 Python 解释器的速度,他一方面参与 Python 自身的优化工作,还帮助微软的其他团队集成面向公众或面向开发人员的 Python 微软产品。

 

当然,除了官方团队,还有个人开发者也尝试过将 python 引入 Excel。开发者“bubblebobble”表示自己几年前构建了一个可用的“Excel 中的 Python”,还远程执行 sql 和 matlab&r。“当我要求进行 beta 测试的一些人说‘他们的公司不会为此付费’、让我觉得我在浪费时间时,我放弃了......”有网友安慰他:“你只是超前于你的时代!”

 

网友:我想让它还支持本地运行

 

对于这项新功能,McKinney 公司数据与分析执行总监 Greg Barnes 称,“对 Python 的全面支持,是我在整个职业生涯中经历过的最令人兴奋的 Excel 更新!”他表示,在 Excel 中运行 Python 的功能,让 McKinney 成功简化了原有报告工作流程。“我们曾经在 Jupyter Notebook 中操作数据结构、过滤和聚合数据,并在 Excel 中构建视觉效果。但现在,我们可以在 Excel 中管理整个工作流,这使得 Excel 变得更加强大,也让 Python 在整个组织中更易于使用。”

 

而网友们也表示开心,但同时也有更多期待。“我希望它不仅仅由 Microsoft Cloud 提供支持,并且可以支持本地运行的 Python,但无论如何,我仍认为这会是巨大的项目,并且会在很大程度上使 Excel 现代化,仅此一点就可以消除只需要这种数据的网站的需求。我想到我以前做的一个项目,就是建立一个分析网站,内部只有少数几个人使用,如果当时有这样的东西,就能很好地满足他们的需求。”开发者“cableshaft”表示。

 

对此,网友“rawgabbit”称,“公平地说,Tableau Desktop、Tableau Prep 和 Tableau Cloud 虽然价格昂贵,但仍然是很棒的产品。借助 Tableau Prep,您可以获得可视化 ETL 工具。从技术角度来说,我更喜欢 SQL,但对于业务人员来说,Tableau Prep 更像是一个 REPL,因此他们可以看到自己的操作将要做什么。他们可以在 Tableau Cloud 中安排这些 Prep 流程,该流程将进行 ETL 并生成每日数据集,然后用户可以通过 Tableau Cloud 上的仪表板进行交互。在我看来,Excel 走在正确的道路上,它具有与 Salesforce、Azure 数据库等开箱即用的连接器。它真正需要的是带有 REPL 输出的完整 SQL,以便用户可以看到其 SQL 的效果。(Tableau Prep 的做法是默认对行进行采样以输出即时结果)。”

 

有开发者指出,云以及尽可能多的云集成是微软的核心战略。这是关于定期付款、锁定以及最终在他们自己计算机上真正拥有世界经济的知识和业务流程。这可能说明了为什么目前只支持云上运行。

 

还有网友指出,“Python 进入 Excel,成为压死 VBA 的最后一根稻草。”VBA 一直是 Excel 脚本编程的主要工具。VBA 简单易学、功能强大,在长达几十年的时间里为提高 Excel 工作效率作出了贡献。但随着 Python 的流行,越来越多的人用 Python 进行 Excel 脚本编程来提高工作效率,VBA 逐渐式微。

 

你对 Python in Excel 有什么看法?欢迎评论区分享哦~

 

参考链接:

https://techcommunity.microsoft.com/t5/excel-blog/announcing-python-in-excel-combining-the-power-of-python-and-the/ba-p/3893439

https://news.ycombinator.com/item?id=37222191

2023-08-25 13:488150

评论

发布
暂无评论
发现更多内容

使用 Gerrit + Zadig 实现主干开发主干发布(含字节跳动飞书实践)

Zadig

DevOps 分支管理 敏捷实践 研发协作 开发模式

微博评论高可用高性能计算架构

地下地上

架构实战营

等保测评结论为差,是不是表示等保工作白做了?

行云管家

等保 等保测评

《网络是怎么样连接的》读书笔记 - WEB服务端请求和响应(五)

懒时小窝

网络

【试用邀请】星环科技TDH社区版:让大数据分析触手可及

星环科技

墨天轮“高可用架构”干货文档分享(含Oracle、MySQL、PG资料124篇)

墨天轮

MySQL 数据库 oracle postgresql 高可用

有了HTTP,为什么还要RPC?

C++后台开发

网络编程 RPC HTTP C++后台开发 C++开发

2022 OpenVINO™ DevCon 大揭秘!英特尔携众多合作伙伴深化开发者生态建设,释放AI产业创新潜能

科技之家

iMile 利用 Zadig 多云环境周部署千次,跨云跨地域持续交付全球业务

Zadig

DevOps 持续交付 跨境电商 自动化运维 Zadig

基于信通院 Serverless 工具链模型的实践:Serverless Devs

阿里巴巴云原生

阿里云 开源 云原生 Serverless Devs

高级性能测试工程师面试必问十大问题

老张

性能测试 软件测试面试

纯CSS 波点背景 🏀

德育处主任

css3 前端 纯CSS css特效 6月月更

wallys/m.2/Adapter card(one pcie1x to 4 x Mini PCIE)

wallys-wifi6

星环科技数据安全管理平台 Defensor重磅发布

星环科技

防范企业数据泄露,就用网络安全产品堡垒机!

行云管家

数据库 网络安全 堡垒机 数据审计

手把手教你安装jdk8配置环境变量

不凡~

wallys/ IPQ4019/IPQ4029 /Access Point Wireless Module Dual band 11AC Wave2 Module

wallys-wifi6

开发一对一直播平台源码有哪些重要的算法?

开源直播系统源码

软件开发 直播源码

CSDN无法复制问题

桥下本有油菜花

CSDN

2022年第一季度保险服务数字化跟踪分析

易观分析

保险 消费金融

攻防演练之战前扫雷:漏洞管理的5大措施

青藤云安全

主机安全 资产安全 漏洞防护 攻防演练

DataKit 作为本地获取数据的 API 服务器

观测云

架构实战营模块五作业

Geek_Q

架构

Numpy 的研究仿制 1

祖维

c Numpy

京东联盟API - 万能转链接口 - 京品库接口 - 接口定制

江苏京酷电子商务有限公司

京东 API JSON格式化 开放api

火山引擎入选国内首个《边缘计算产业全景图》

火山引擎边缘云

云计算 云原生 边缘计算 火山引擎 火山引擎边缘计算

瓜分1000+万奖金池,昇腾AI创新大赛2022实力赋能开发者

Geek_2d6073

从第三次技术革命看企业应用三大开发趋势

葡萄城技术团队

wallys/ IPQ4018/IPQ4028/Access Point Wireless Module Dual band 11AC Wave2 Module

wallys-wifi6

《网络是怎么样连接的》读书笔记 - 服务器端的局域网中(四)

懒时小窝

网络

Sophon CE社区版上线,免费Get轻量易用、高效智能的数据分析工具

星环科技

七年没能将Python 集成到 Excel,Python 之父加入微软三年后成了!_编程语言_褚杏娟_InfoQ精选文章