在 4 月 23 日至 25 日召开的 QCon Beijing 2010 大会上,来自豆瓣网的洪强宁为与会开发者分享了 Python 语言用于 Web 2.0 网站开发的经验。豆瓣网从开发初期,便选用 Python 作为主要的网站构建语言,同时 Python 也是目前豆瓣网使用最广泛,基础最深厚的语言。作为豆瓣网首席架构师,洪强宁和他带领的技术团队在网站开发过程中,在 Python 语言使用方面积累了大量经验,同时在网站架构、性能、可伸缩性方面进行了深入研究。
在 QCon 大会期间,InfoQ 中文站编辑就 Python 语言本身的特性,Python 在 Web 2.0 站点开发中的适用性,以及豆瓣网的 BeansDB 开源项目等内容,对洪强宁进行了访谈。就 Python 语言在 Web 2.0 网站开发方面的生产率,洪强宁谈到:
Python 语法简明,具备很强的易用性,能够帮助开发团队以最为高效率的速度完成工作任务。对于刚开始使用 Python 工作的程序员,完成 Hello World 例子不会超过 1 分钟,学习编写文本处理工具用一个下午的时间即可,而完成一个实用程序的编写,即便是新手,也仅需要一周的时间。 我在 2002 年开始接触 Python,从 2004 年到现在基本完全使用 Python 进行工作。Python 语言在降低工作成本方面有着显著的效果,同时,由于 Python 语言存在如强制缩进这样的约定,能够在一定程度上避免程序员编写代码的个人风格化,以保证代码始终具备良好的可读性。目前,豆瓣网目前约有近六成的代码是使用 Python 语言编写,另外不到三成使用 C 语言,其次是 JavaScript 代码,还有少量代码使用 C++,Erlang,Go,Pyrex,R 以及 Shell 编写。
在 QCon 演讲中,洪强宁和观众分享了 Python 语言的特点及优势,并结合豆瓣开发过程中的多个实际案例,阐述 Python 如何做到简化常见的开发场景,并使豆瓣网能够充分适应 Web 2.0 时代所带来的快速变化。就 Python 语言的适用范围,洪强宁谈到:
Python 具有非常宽广的适用面,对于 Web 2.0 网站来说,从 Web 应用开发到离线计算,从运维脚本到数据分析,都能够使用 Python 来完成。同时 Python 具有非常丰富的资源,其标准库所包含的内置模块超过 200 个,Pyhton 的包索引 PyPI 中包含接近一万个 Packages,面向的领域包含网络处理、数据库、桌面开发、游戏、科学计算、安全、文本处理等在内的各个层面,同时语言本身具备很好的拓展性,能够在 Python 脚本中调用 c/c++ 的库,对语言功能进行扩充。
对于 Web 开发来说,Python 有着众多的框架,往往让刚开始上手的开发者难以选择。对与网站 Web 开发框架的选择,洪强宁谈到:
由于 Python 社区的历史问题,积累了众多 Python 语言实现的 Web 开发框架,如 Django、TurboGears、Quixote 等,这些 Web 开发框架各有自己独到的优势,同时也各自吸引了一批坚定的开发者为其不断添砖加瓦,从某种程度上,削弱了 Python 社区的凝聚力。相对于 Ruby 社区,几乎所有的 Web 开发都使用 Ruby on Rails 完成,凝聚了开发者的力量。但 Python 不乏功能强大的基础框架,在 Python 语言实现的 WSGI(Web 服务网关接口)帮助下,开发人员甚至可以在数小时之内编码实现一个自己的 Web 框架,来完成最大自主程度的 Web 开发工作。
近期豆瓣网将基于 Dynamo 简化开发的 BeansDB 贡献给开源社区。 BeansDB 提供高可用性的分布式 KeyValue 存储系统,采用 HashTree 和简化的版本号来快速同步保证最终一致性。就 BeansDB的技术实现和应用场景,洪强宁谈到:
BeansDB 采用类似 Memcached 的去中心化结构,在客户端实现数据路由。目前提供了 Python 版本的客户端,其它语言的客户端可以由 Memcached 的客户端改造得到。同时提供 BeansDB 状态查看,以及各个节点的数据分布和同步进度查询功能。BeansDB 的典型应用体现在图片文件、小媒体文件、大文本字段等多媒体数据的存储。BeansDB 的易用性和高可用性体现在部分节点出现故障时不影响数据服务的正常访问,同时通过哈希树实现快速完整数据同步。
豆瓣网以多年 Python 开发的实践经验,为 Python 语言在国内 Web 2.0 站点开发中的应用给出了最佳成功案例,也吸引了一批 Web 2.0 站点的开发者将 Python 列为首选语言。期待明年的 QCon 大会,来自豆瓣网的工程师能够为开发者分享更有价值的开发经验。
评论