写点什么

入门数据科学,70% 的人都做错了

  • 2019-08-17
  • 本文字数:1036 字

    阅读完需:约 3 分钟

入门数据科学,70%的人都做错了

在大学的大部分时间里,我都在积极地学习困难但有用的课程。但是,到了最后一个学年,我感觉累了,我想休息一下,所以我选了一门“有趣”的工程系课程,叫做“航海物理学”。


我们研究了什么样的动力会让帆船的速度快过风,以及船的形状如何影响其自身的稳定性。我比大多数同学学到了更多的物理知识。很自然的,我的功课做得很好,而且如果我想去航海,我会是一个行家。


我在学期末验证了这个假设。当时我们去了马斯卡湖,试着行驶一艘真正的船,但事情并不像我预料的那样。


船有点晃动,我所掌握的有关浮力和“扶正手臂”的知识并没能让我好好地呆在船上。转弯需要协调多种动作,如果时间点不对,一根两米长的金属杆(吊杆)就会碰到我的脑袋,每一次敲击脑袋发出的隆隆声都会导致我出现几分钟的耳鸣。


航海物理知识很有趣,但很明显,在你真正开始航海时,它们并不一定管用。


那么,这和数据科学有什么关系呢?


就像我在没有实际航海经验的情况下学会了航海物理学,大多数数据科学课程非常详细地介绍了一些算法,但却忽略了成功的数据科学项目所需要的技能。


企业数据科学仍然是一个新的领域。很多学者都还没有为为真正的企业解决过真正的问题,所以他们以一种与数据和业务环境相分离的方式教授教科书中的算法。从智力方面看,这是一种乐趣。但是,如果学生们认为学好这些课程为就等于为成为数据科学家做好了准备,那他们就错了。


那么如何将你的学习精力放在重要的实操技能上呢?以下是一些值得一看的指南


  • 使用标准的开源库。数据科学通常会依赖具有良好的文档和设计并经过良好测试的 API 库。自己去实现这些东西会带来不必要的复杂性和 bug,并且会让你分心。

  • 花更多的时间研究数据模式,并将其转换成所需的格式。大多数项目涉及大量的数据操作和相对较少的模型调优。正在招聘数据科学家的朋友告诉我,很多求职者都能描述算法,但绝大多数人缺乏 pandas 相关的技能,无法在实际工作中高效地完成任务。

  • 了解技术的应用背景。在描述技术实用性时,如果你还是满嘴技术术语,说明你可能还没有准备好应用它。

  • 学会如何解释模型输出。例如,你需要了解如何度量模型的准确性,以此来判断是否可以信任模型。

  • 在你感兴趣的领域内构建项目,它可以与电影、时事、体育、食物或任何其他事情有关。这将教会你如何以一种非常实用方式来构建有关外部世界的无定形问题。这是数据科学家最重要的技能之一。分享你的工作成果,学会如何解释和讨论结果,这可能是最为重要的技能。

  • 跳过教科书和课程提及的算法理论,会更容易地成为一名数据科学家吗?当然不是。


2019-08-17 07:553795
用户头像

发布了 38 篇内容, 共 31.7 次阅读, 收获喜欢 208 次。

关注

评论

发布
暂无评论
发现更多内容

百度世界2023剧透丨百度王颖:百度文库每周上线2-3个AI新功能,累计使用次数近亿

彭飞

Apache IoTDB 作为合作伙伴参加 Doris Summit Asia 2023!

Apache IoTDB

WorkPlus一站式解决方案,助力企业构建统一门户系统

BeeWorks

请查收:赛博威TPM营销费用管理指南——费用管理类型篇

赛博威科技

营销数字化

华为云API图像识别Image的趣味性—AI识别迈克尔·杰克逊

YG科技

Last Week in Milvus

Zilliz

非结构化数据 Milvus Zilliz AIGC

最高评级!华为云CodeArts Board获信通院软件研发效能度量平台先进级认证

YG科技

华为云发布CodeArts Governance开源治理服务,开源使用更安心

YG科技

Linux是什么,其特点是啥

芯动大师

华为云API图像搜索ImageSearch的快捷性—AI帮助您快速归类图片

YG科技

Redis Scan原理

宁静知行者

redis 底层原理

软件测试/测试开发丨App自动化—CSS 定位与原生定位

测试人

Python 程序员 软件测试 自动化测试 测试开发

国产化即时通讯平台WorkPlus,助力企业实现自主可控的沟通与协作

BeeWorks

别再说被八股文害惨了!GitHub阿里Java面试题库标星145K不无道理

程序员万金游

#java #面试 #编程 #程序员 #Mysql

Web3 新手攻略:9个不可或缺的APP助力你踏入加密领域

股市老人

新手必看!Bitget Wallet 和 Metamask 到底该选谁?真实对比评测

BlockChain先知

慕圣妃轻医美4998系统开发

张泽🐟APP小程序开发定制

低代码开发不可能取代程序员

互联网工科生

低代码

设计师、教师、奶爸从零开始做提示词,文心一言APP让提示词“人人可用”

彭飞

终极对决!Bitget Wallet vs Metamask 钱包大比较!隐藏功能曝光

石头财经

除了Office,这8款好用的办公软件也值得推荐!

彭宏豪95

效率 职场 软件推荐 在线白板 办公软件

OpenHarmony嵌套类对象属性变化:@Observed装饰器和@ObjectLink装饰器

OpenHarmony开发者

WorkPlus私有部署即时通信助力企业信息安全与高效协作

BeeWorks

天谋科技与华为鲲鹏完成兼容性互认证

Apache IoTDB

百度世界2023剧透丨肖阳:「语义检索技术+大语言模型」融合,百度「新搜索」将亮相

彭飞

代码混淆界面介绍

雪奈椰子

基于 ACK Fluid 的混合云优化数据访问(三):加速第三方存储的读访问,降本增效并行

阿里巴巴云原生

阿里云 云原生 容器服务

华为云持续扎根软件工具生态,突破10倍研发效能赋能千行百业

YG科技

入门数据科学,70%的人都做错了_AI&大模型_Dan Becker_InfoQ精选文章