引言
数据科学快速成为各个开发人员和管理人员的关键技能,它看上去也十分有趣。但它也是相当复杂,因为存在很多的工程分析技术,你很难知道自己做得对不对或者哪里会有陷阱。在这一系列文章中,我们将探讨如何利用数据科学,即从已经采用并成功实施数据科学的人那里,了解数据科学的适用场景,以及如何让它成为你的资产。
内容
企业愈发意识到,只要稍微运用一点数据科学就可以解决许多紧迫的问题。
此文是该系列文章中的第一篇。 Francine Bennett在文中着眼于那些成功的面向业务的数据科学项目。
将大数据和数据科学技术应用到企业组织里是变革性的项目,它有点类似向敏捷转型,同样充满了挑战。
在此文中, Christian Prokopp阐述了某个 FTSE100 金融服务公司的一个数据科学应用项目。
Rafael Fernandes对机器学习领域做了简明扼要的介绍,并探讨了有监督学习和无监督机器学习方法。
随着Cassandra 和MongoDB 这样的非结构化数据库技术的出现,以及PostgreSQL 对JSON 的支持,非结构化数据已经变得相当易于存储和处理。很多情况下,软件工程师和数据工程师可以从数据建模中解脱出来,数据建模不再是采集数据并从数据中挖掘价值的先决条件。在此文中, Rishi Nalin Kumar介绍了数据的结构化及其它相关内容。
虽然Clojure 在工具和社区方面对深受欢迎的数据科学语言R 和Python 的支持并不好,但是它为发展统计思维和实践数据科学提供了良好的环境。作为一名主要使用Clojure 编程语言的数据科学家, Henry Garner常被问及为什么他不选用其它应用范围更广的编程语言。在此文中,他给出了自己选择 Clojure 的理由。
书评: Cathy O’Neil的《Weapons of Math Destruction》
Cathy O’Neil写道:“大数据有很多推崇者,但我不是。”O’Neil是一个博主 (mathsbabe.org),也是 DE Shaw 对冲基金的前量化策略分析师,她因为对冲基金模型大失所望,参加了占领华尔街运动。
该系列文章的策划人
Francine Bennett是 Mastodon C 的联合创始人兼 CEO。Mastodon C 专注敏捷大数据,为大型组织提供基于 Hadoop 和 Cassandra 的开源技术和分析技能,帮助他们挖掘数据的潜力。
Bennett是一名公认的分析应用程序和“数据科学”技术专家。她是英国皇家学会的特邀发言人,同时也为英国内阁办公室提供关于如何更好地使用数据的建议。她拥有数学和哲学学位,曾在谷歌担任分析主管。此外,她还是 DataKind UK 的理事。
查看英文原文: Getting a Handle on Data Science
评论