一、SNDACode 和它的发展
SNDACode 是盛大创新院旗下的一个开源平台,主要用于展示盛大集团开放的源代码及 API,也有盛大员工个人开发代码的展示。覆盖的项目包含语音,云计算,开发框架,SDK 等领域。开发者可以从 SNDACode 可以看到盛大最新的开源项目,也可以在上面提交 issues,进行交流。除了特别声明的软件外, SNDACode 上面的所有软件都遵循 GPLv2 协议开源。下面是简要介绍一下其中的几个项目。
二、SNDACode 上的项目介绍
Snda Humming
哼唱检索是一种基于音乐旋律内容的音乐检索方式,使得用户可以通过哼唱歌曲旋律的一个片段作为输入检索源从歌曲旋律库中检索音乐。相对于传统基于文本关键字的音乐检索,哼唱检索给用户提供了更便捷、更友好的查询方式,不仅作为传统文本检索的一种有益补充,而且能给用户带来更佳的搜索体验。
使用 C++ 作为开发语言的 Snda Humming,利用 MIDI 文件中包含的旋律信息构建旋律库。IDI (Musical Instrument Digital Interface) 文件记录了歌曲乐谱音高,时长,力度等旋律信息。此外,为了支持用户可以从一首歌的任何位置开始唱起这一功能,系统采用乐句切分方法,定位搜索入口点。
与同类型软件相比,SNDA Humming 采用了一种对用户哼唱不加任何限制的语音输入方式,用户可以自然的输入哼唱旋律,如可以唱出歌曲的歌词,或者唱出乐谱,甚至可以用鼻音、无意义的音节哼出歌曲的曲调。
在算法的采用上面,欧氏距离 (Euclidean Distance) 和动态时间弯曲距离 (Dynamic Time Warping Distance) 的结合使用,让 SNDAHumming 能更加精确地计算出旋律相似度。
本软件的前身在 2008 年的国际音乐检索评测中获得第一名,识别准确率高,响应速度快。具有良好的扩展性,用户可根据需求制作自己的音乐旋律库。可以为对音频信息处理领域感兴趣的开发者提供了完整的学习案例和试验平台。
PHPCMS
采用 PHP5+MYSQL 做为技术基础进行开发,遵循 OOP(面向对象)方式进行基础运行框架搭建。以模块化做为功能开发的形式,使得框架结构更为清晰,代码更易于维护。也让扩展性得到保证。
另外 PHPCMS 在开源 CMS 中率先引入站群系统,多发布点,数据表分离等功能。
所谓站群是指建立在统一标准、统一技术构架基础之上,分级管理,分级维护,信息可以实现基于特定权限共享呈送的网站集合。并不是把很多个网站集中在一起就可以称得上是站群了。PHPCMS 实现了技术标准统一,站点间互联互通,比如单点登录等。
通过发布点对应的 FTP 配置信息,可以将多个站点分别部署到不同服务器上,分站域名指向站点内容所属目录或服务器,轻松实现多域名访问和服务器集群布置。
PHPCMS 在系统构架中,为每个数据表分别建立不同的数据模型文件,此文件中配置了该表所属数据库服务器 IP,表前缀、表名等相关信息。系统程序运行中通过加载相关表的配置文件,来建立该表的数据模型类,进而操作该表。让用户将数据表分离到不同的数据服务器上,实现强大的负载均衡。
tcdatabase
SNDACode 上的很多项目是员工个人开发的,tcdatabase 就是其中之一。以 TC(Tokyo Cabinet) 的 B+Tree 数据引擎为基础开发的数据库。利用 TokyoTyrant 中的 skeleton 功能实现扩展。可以使用以下代码启动:
ttserver -skel tcdatabase.so -port 3900 db_filename.tcb
TC(Tokyo Cabinet) 是日本人平林幹雄开发的一款 Key-Value 键值数据库。TT(Tokyo Tyrant ) 是由同一作者开发的 Tokyo Cabinet 数据库网络接口。它拥有自己的协议, 并支持 Memcached 兼容协议, 也可以通过 HTTP 协议进行数据交换。TCTDB 的读写性能很强,又支持 MySQL 单表的一些功能,但任然有许多的不足。
TCDatabase 就是在这个的基础上进行改进。在 TCDatabase 中支持多个 table 从一个端口访问,实现了 Table Database 支持多个表。原有 TCTDB 功能增强,读写性能损失过大的问题也在其中得到了解决。数据文件改用采用 TCBDB(B+Tree Database) 进行存储,数据量上亿后性能也不会明显下降。
在性能优化的基础上,TCDatabase 能够区分 value 的类型,建立数值索引。同时支持列读写,可以单独获取更新 value 中的某一字段。另外还能够限制查询的时间实现慢查询。TCDatabase 强大的功能使之有可能成为云数据库的数据引擎。
Jscex
Jscex 是 JavaScript Computation EXpressions 的缩写,它为 JavaScript 语言提供了一个 monadic 扩展。Jscex 项目完全使用 JavaScript 编写,能够在任意支持 ECMAScript 3 的执行引擎里使用。小巧而强大,JIT 编译器能在运行时将 JavaScript 代码编译成 Monad 形式,无需额外编译步骤,并内置异步编程类库,可以大大简化 JavaScript 下的异步编程体验。
三、盛大目前开源状况以及开放的 API
除了上面介绍的项目之外,盛大 Bambook,everbox 的 SDK 也在 SNDACode 上公开了源代码。Bambook 是盛大旗下经典的电子阅读器平台,everbox 则是大容量网盘。开发者可以利用其开放的 API 编写丰富的应用。
另外还有其他一些有趣的项目,比如说用于消息队列管理的 DOMQ,java/jsp 的敏捷开发框架 xiaojie’s framework 等等。感兴趣的同学可以访问 SNDACode.com 了解更多的项目。也希望这个平台能够促进开发者之间的交流,为国内的开源事业发展尽一份绵薄之力。另外 SNDACode 下的一个开源程序比赛的平台也正在筹划过程中,更多的实时信息也可以关注 SNDACode 的新浪微博 SNDACode 。
感谢张凯峰对本文的审校。
给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家加入到 InfoQ 中文站用户讨论组中与我们的编辑和其他读者朋友交流。
评论