来源:Datawhale
文章插图
这是一篇关于如何成为一名 AI 算法工程师的长文~
经常有朋友私信问,如何学 Python 呀,如何敲代码呀,如何进入 AI 行业呀?
正好回头看看自己这一年走过的路,进行一次经验总结 。
来看看你距离成为一名 AI 工程师还有多远吧~
?具体内容:
- 我是因为什么开始接触敲代码
- 人工智能/机器学习/深度学习
- 自学如何寻找学习资料
- 如何选择编程语言/框架
- 校招/社招/实习/面试经验
- 一碗鸡汤
- 本篇内容均属于个人观点,建议采纳对自己有用的经验,如有疏漏,欢迎指正,共同进步!
- 2017 年 5 月开始第一份实习 / 2017 年 7 月开始学敲代码 / 2017 年 11 月硕士毕业
- 擅长的编程语言:R / Python
- 不花钱报班,全靠自学,最初是因为穷,后来发现「开源」的世界真是太美好了!
文章插图
我是因为什么开始接触敲代码?
我的第一个模型是什么?
由于本科是数学,研究生是量化分析,第一份实习是一家金融科技公司,开始接触所谓的「Fintech」
第一个任务就是做客户的信用评分卡模型,目的给每个用户打一个信用分数,类似支付宝的芝麻信用分 。这是银行标配的一个模型,最常见最传统的算法用的就是逻辑回归 。
在课堂上使用的工具是 SAS,SPSS,属于有操作界面的,菜单非常齐全,只需要鼠标点一点就能建模,很好上手 。但是 SAS 这些要付钱的,年费还是相当的贵,所以深圳大部分公司进行数据分析和建模工作都选择开源免费的 R 语言或者 Python 。这就体现了掌握一门编程语言的重要性 。
虽然说是建模任务,但是前三个月跟建模基本都扯不上边 。都在做数据清洗,表格整理(摊手),都在 library 各种包,用的最多的可能是 data.table 和 dplyr 。没办法,很多模型都有包可以直接调用,是最简单的环节了 。
其实一开始,我一直在犯很低级的错误,各种报错,没有 library 啦,标点符号没打对啦,各种很 low 的错误犯了一次又一次,而且连报错的内容都不会看,不知道怎么去改正 。如果你也像我一样,真的请不要灰心,我就是这样走过来的 。对着错误一个个去解决就好了~
当时什么都不知道的时候,觉得真难呀,每个环节都有那么多细节要照顾,要学的那么多,做完一个还有一个,还要理解业务含义 。但是当完整的做一遍之后再回头,就会觉得,其实,也没那么难嘛~
文章插图
敲代码容易吗?
因为我不是计算机专业的,所以基本上属于没怎么敲过代码的那种 。
后来发现程序员也有好多种类的,前端后端等,因此敲的代码种类也很多,才会有几十种的编程语言,下图是一些这几年的主流语言 。
文章插图
【这是一篇关于如何成为一名AI算法工程师的长文】实习时我一直被队友嫌弃很蠢,而且一开始敲的东西怎么也运行不通,运行出来的都是鬼结果 。有 n 次想放弃的念头,「我干嘛一定要敲这玩意儿?」,但也有 n+1 次想坚持的理由,因为我真的喜欢我正在做的事 。为什么用「坚持」,因为真的不容易 。不难,但真的需要有耐心 。
一开始我的状态就是一行行代码的运行,一个个命令的熟悉,反复看,反复运行 。
- 从敲出第一行代码到敲出第一个完整的模型花了 3 个月 。
- 学习 XGBoost,光是理论学了 3 个月,因为前期铺垫要学的还有 adaboost/gbdt 和各种机器学习的知识模块 。
- 从 R 切换到 python 花了 1 个月 。
- 从机器学习 (machine Learning) 切换到自动机器学习 (Auto Machine Learning) 花了 2 个月 。
- 从 NLP 零基础到搭建一个智能问答机器人花了 1 个月 。
文章插图
可以看出,经过前面的积累,后面会学的越来越快 。
慢慢的就从一开始的那种「唉,怎么又报错啊,好挫败」的心态变成现在的「啊?没 error?感觉不对啊,再查验一遍吧」这种抖 M 倾向的人 。代码虐我千百遍,我已经被磨的没有了脾气 。
推荐阅读
- 关于茶文化的涵意介绍
- 关于中国贵族茶道的介绍
- 关于流感疫苗,这些核心信息你知道吗?
- 公租房最长可以住多久?关于公租房你了解多少?
- 总结了些关于茶道的内涵
- 关于茶道修持说的介绍
- 关于工夫茶道与日本茶道的介绍
- 精挑细选关于风水的书籍
- 发型|这是我喜欢的发型,短发利落中发好打理长发很心动,赶快收藏吧
- 关于宋祖英茶道养生之道