这是一篇关于如何成为一名AI算法工程师的长文( 五 )


我实习做的评分卡模型,除了传统逻辑回归,也尝试新的 XGB 等等,而且虽然别人也在做,但是私下自己会把整个模型写一遍,包含数据清洗和模型调优等,这样对业务的了解也更透彻,面试起来所有的细节都是亲手做过的,也就比较顺了 。
如果没有实习在手,世界给我们数据挖掘选手的大门还是敞开着的 。kaggle 上有专门给数据挖掘入门者的练习场 。相关的比赛还有很多,包括腾讯、阿里等大厂也时不时会发布算法大赛,目测这样的算法大赛只会越来越多,你坚持做完一个项目,你在平台上还可以得到相关名次,名次越靠前越有利哈哈哈这是废话 。
BAT 常见的面试题(不分先后)

  • 自我介绍/项目介绍
  • 类别不均衡如何处理
  • 数据标准化有哪些方法/正则化如何实现/onehot 原理
  • 为什么 XGB 比 GBDT 好
  • 数据清洗的方法有哪些/数据清洗步骤
  • 缺失值填充方式有哪些
  • 变量筛选有哪些方法
  • 信息增益的计算公式
  • 样本量很少情况下如何建模
  • 交叉检验的实现
  • 决策树如何剪枝
  • WOE/IV 值计算公式
  • 分箱有哪些方法/分箱原理是什么
  • 手推 SVM:目标函数,计算逻辑,公式都写出来,平面与非平面
  • 核函数有哪些
  • XGB 原理介绍/参数介绍/决策树原理介绍/决策树的优点
  • Linux/C/JAVA 熟悉程度
  • 过拟合如何解决
  • 平时通过什么渠道学习机器学习(好问题值得好好准备)
  • 决策树先剪枝还是后剪枝好
  • 损失函数有哪些
  • 偏向做数据挖掘还是算法研究(好问题)
  • bagging 与 boosting 的区别
  • 模型评估指标有哪些
  • 解释模型复杂度/模型复杂度与什么有关
  • 说出一个聚类算法
  • ROC 计算逻辑
  • 如何判断一个模型中的变量太多
  • 决策树与其他模型的损失函数、复杂度的比较
  • 决策树能否有非数值型变量
  • 决策树与神经网络的区别与优缺点对比
  • 数据结构有哪些
  • model ensembling 的方法有哪些
小结
问题是散的,知识是有关联的,学习的时候要从大框架学到小细节 。
没事多逛逛招聘网站看看招聘需求,了解市场的需求到底是什么样的 。时代变化很快,捕捉信息的能力要锻炼出来 。你可以关注的点有:职业名/职业方向/需要会什么编程语言/需要会什么算法/薪资/...
每个面试的结尾,面试官会问你有没有什么想问的,请注意这个问题也很关键 。
比如:这个小组目前在做什么项目/实现项目主要用什么语言和算法/…
尽量不要问加不加班,有没有加班费之类的,别问我为什么这么说(摊手)
在面试中遇到不理解的,比如 C++语法不懂,可以问这个 C++具体在项目中实现什么功能 。如果你提出好问题,能再次引起面试官对你的兴趣,那就能增加面试成功率 。
应届生就好好准备校招,别懒,别怕输,别怕被拒,从哪里跌倒从哪里起来 。社招不是你能招呼的,会更挫败,因为你什么也没做过 。
虽然是做技术的,但是日常 social 一下还是收益很大的 。实习的时候,也要与周围同事和平相处,尤其是老大哥们,也许哪天他就帮你内推大厂去了 。内推你能知道意想不到的信息,面试官,岗位需求,最近在做什么项目之类的 。
挑选给你机会的公司,不要浪费自己的时间 。不要每家都去,去之前了解这家公司与你的匹配度 。
尤其社招,你一改动简历就很多人给你打电话,你要有策略的去进行面试,把握总结每个机会 。像我就是东一榔头西一榔头的,好多都是止步于第一面,就没回信儿了,因为每次面完没有好好反思总结,等下次再遇到这问题还是抓瞎,十分消耗自己的时间和信心 。
 




推荐阅读