积分机
雷锋网AI科技评论按:如果未来的你将踏上机器学习工程师这条道路,那你很大可能将遇到和机器学习工程师DanielBourke相似的经历。在这一年的机器学习相关工作中,他发现很多事情都和想象的不同,有些事情也许看似没有意义,却价值无穷。于是,他将这些经历与感悟总结起来,写成了下面这篇文章。雷锋网AI科技评论将其编译如下,相信这些经历与建议也会给未来将踏入AI行业的你带来很大的启发。工作站,家庭办公室和艺术工作室(照片由作者提供)引入实际上,机器学习和数据科学领域所涉及的工作并非想象那么单一;相反的是,它所涵盖的内容非常广泛。往往一位数据科学家所做的与另一位会有很大的不同。机器学习工程师也是如此,只有在使用历史(数据)来理解或预测未来(建模)这方面比较相似。为了将这些要点展现在下文中,我首先解释一下我工作中所担任的角色。我们有一个小机器学习咨询团队,其中的内容包含了从数据收集到操作、模型构建再到能想到的每个行业的服务部署,所以我们每个人都扮演着多种角色。作者DanielBourke的社交动态工作日常早上9点我走进办公室,问候大家早安,然后把食物放在冰箱里,倒一杯咖啡,走到我的办公桌前坐下,看前一天的笔记,顺便打开Slack,阅读消息以及团队共享论文或博客文章的链接。这个领域发展很迅速,因此每天都有一些新文章。所以通常在读完未读消息后,我会花一阵时间来浏览论文和博客文章,并仔细研究那些理解起来较困难的内容。这其中,有一些内容可能对我正在做的工作有所帮助。关于阅读时长:一般来说,阅读会花费我大概一个小时甚至更久,这取决于文章本身。有些朋友会疑惑为什么我在阅读上花费这么久的时间。但在我看来,阅读是一种终极元技能。因为一旦有更好的方式来完成我当前在做的事情,我可以通过学习并使用它,从而节约更多的时间和精力。但阅读也有特殊情况,如果有一个项目的截止日期临近,那么我将把阅读时间缩短来推进该项目。然后我会检查前一天的工作,检查我的记事本所记下的被搁置的工作,这是每天最重要的一部分。我的记事本是当天的流动日记,例如:「我已经将数据处理为正确格式,现在需要在模型中运行它。我将训练的启动变得迅捷,当程序完成后就马上进行训练。」如果我在工作过程中遇到了困难,则会写下类似于:「发生了数据不匹配的情况,接下来我将尝试修复混合匹配,并在尝试新模型之前获得基线。」然后到下午4点,我会开始整理今天的工作,包括:整理写下的混乱代码,使其清晰明了,然后添加注释,最后将它们进行更好的组合。因为我常常会想,如果其他人不得不读这个怎么办?而刚好通常阅读这个代码的人就是我自己,我还经常会在短时间内忘记一连串的思路......下午5点时分,我的代码已经被更新在GitHub上了,然后我就会在笔记本上记下第二天要做的事情。这是理想的一天,但并非每一天都如此。有时我也可能在下午4:37时,突然产生一个新颖的想法,然后去尝试完成它。现在你已经大致了解机器学习工程师日复一日的工作日常了,接下来我将具体阐述在工作中所学到的一些关于机器学习的经验与教训。(希望对你有帮助~)从机器学习工程师中学到的12件事1.机器学习始终与数据有关很多时候,机器学习工程师会专注于构建更好的模型,而不是改进构建它的数据。尽管构建更大的模型并使用更强的计算能力可以提供令人兴奋的短期结果;但是只在意眼前,你最终会在长期目标上栽跟头。首次接触一个项目时,请花费大量「不正常」的时间去熟悉数据。我这里说的「不正常」,通常是你预估时间的三倍。但从长远来看,这将节省你的时间。这并不意味着你不应该从细节着手,因为对于任何新数据集,你首先应该明确的目标是成为这方面的「专家」。检查分布、找到不同类型的特征、异常值在哪儿、为什么它们是异常值……如果你无法讲出当前使用的数据信息,那又怎么让模型更好的处理这些数据呢?探索性数据分析生命周期的示例,更多关于探索性数据分析的详细介绍(

转载请注明:http://www.aideyishus.com/lkgx/8050.html
------分隔线----------------------------