这是一篇关于如何成为一名AI算法工程师的长文( 二 )


已经有几个朋友说想转行了,我何曾没想过,只是不知不觉中坚持了下来而已 。因为热爱,越虐越停不下来
小结
设定一个非常清晰的目标
为什么第一个写:「我是因为什么开始敲代码的」,因为动机真的非常重要!
所以,很多人在问我「如何学 python?」这种问题时,我的第一回答都是「你学 python 用来干嘛?」
在学校也敲打过 python,做个爬虫 demo 什么的,因为目的性不强没多久就放一边了 。清晰的目标就比如说你要做 NLP,你要知道 NLP 的应用有智能问答,机器翻译,搜索引擎等等 。
然后如果你要做智能问答你要知道现在最发达的技术是深度学习,使用的算法有 RNN/LSTM/Seq2Seq/等等一系列 。
而我的清晰目标是在实习的时候给我的任务 。当任务很明确的时候,所需要的语言就明确了,所要学习的算法也就明确了,很多东西就顺理成章了不用一头乱撞了 。
从金融到科技
AI 的应用范围很广,每一个研究方向都是无穷尽的 。由于金融公司很少与图像处理,NLP 等技术会有交集,而我强大的好奇心让我决定去纯粹的科技公司一探究竟 。目前已投身于智能家居,目标是 Javis
?人工智能/机器学习/深度学习
我经常在公交的广告牌上看见这些词,好像哪家公司没有这个技术就落后了似的 。更多的还有强化学习,迁移学习,增量学习等各种学习 。
这些词儿之间到底什么关系?
机器学习是人工智能的一种,深度学习是机器学习的一种 。学 AI 先学机器学习 。

这是一篇关于如何成为一名AI算法工程师的长文

文章插图
 
计算机的「算法」与 数学的「算法」的区别
理论知识对于 AI 算法工程师极其重要 。敲代码只是思路的一个实现过程 。这里的「算法」和计算机 CS 的「算法」还不太一样,AI 算法是偏数学推导的,所以数学底子还是需要点的,学的越深,要求越高 。面试的时候,很少让手写代码,90% 都是在问模型抠算法细节 。
在学校我是一个不爱记笔记的人,甚至是一个不爱上课的人 。但是自从入了机器学习的坑后,笔记写的飞起~
这是一篇关于如何成为一名AI算法工程师的长文

文章插图
 

这是一篇关于如何成为一名AI算法工程师的长文

文章插图
 
机器学习的框架
按照数据集有没有 Y 值可以将机器学习分为监督学习、半监督学习和无监督学习 。监督学习是分类算法,无监督学习是聚类算法 。
这是一篇关于如何成为一名AI算法工程师的长文

文章插图
 
机器学习的通用流程和相关技术如下图:
这是一篇关于如何成为一名AI算法工程师的长文

文章插图
 
ML 这棵树还可以有更多的分支 。先有个整体感受,再一个一个的解决掉 。这里的知识点也是面试最爱问的几个,是重点呀!面试过的同学应该都不陌生了 。
机器学习如何入门
机器学习之大,初学者都无从下手 。说白了,机器学习就是各种模型做预测,那么就需要有数据,要想有好的效果,就要把原始的脏数据洗干净了才能用 。数据内隐藏的信息有时候是肉眼不可见的,那么就需要一些相关技巧来把有用信息挖出来 。所有绞尽脑汁使用的技巧,都是为了能预测的更准确 。但是谁也没办法做到百分百的命中 。
这里简单介绍下机器学习的三大块:传统的机器学习 ML、图像处理 CV、自然语言处理 NLP 。
再推荐一个入门神器:
  • Kaggle(www.kaggle.com)
这是一个世界级的最权威的机器学习比赛,已被谷歌收购 。上面的赛题不仅很有代表性,还有很多免费的优秀的数据集供你使用,要知道收集数据是机器学习的第一大难题,它就帮你解决了 。入门不用立马参加比赛,把数据下载下来,尽情折腾就好了,要是没有思路,去网上搜别人的解题笔记和代码借鉴一下也很美好~因为这是大家都争相打榜的比赛,所以你并不孤单 。
ML 入门该参加的赛题(Titanic)
这是一篇关于如何成为一名AI算法工程师的长文

文章插图
 
图像入门该参加的赛题(数字识别)
这是一篇关于如何成为一名AI算法工程师的长文

文章插图
 
NLP 入门该参加的赛题(情感分析、quora 问句语义匹配)
这是一篇关于如何成为一名AI算法工程师的长文

文章插图
 


推荐阅读