CSDN攻克机器学习硕士学位,我的那些年与必备技能!( 三 )


  • MLP:多层感知器(MLP)是几层感知器 , 一个接一个地连续堆叠 。 MLP由一个输入层 , 一个或多个TLU层(称为隐藏层)和一个最后一层(称为输出层)组成 。
  • NST:一种涉及利用深度卷积神经网络和算法从一幅图像中提取内容信息并从另一幅参考图像中提取样式信息的技术 。 在提取样式和内容之后 , 将生成一个组合图像 , 其中生成的图像的内容和样式来自不同的图像 。
  • RNN和LSTM:神经网络体系结构的一种变体 , 可以接受任意大小的输入作为输入 , 并生成随机大小的输出数据 。 RNN神经网络架构学习时间关系 。 人脸检测:这是实施系统任务的一个术语 , 该系统可以自动识别和定位图像和视频中的人脸 。 在与面部识别 , 摄影和运动捕捉相关的应用程序中存在面部检测 。
  • 姿势估计:从提供的数字资产(例如图像 , 视频或图像序列)中推断出人体主要关节位置的过程 。 姿势估计的形式存在于诸如动作识别 , 人类交互 , 为虚拟现实和3D图形游戏创建资产 , 机器人技术等应用程序中 。
  • 对象识别:识别与目标对象关联的类的过程 。 对象识别和检测是具有相似最终结果和实现方法的技术 。 尽管识别过程先于各种系统和算法中的检测步骤 。
  • 跟踪:一种在一段时间内识别 , 检测和跟踪图像序列中的关注对象的方法 。 在许多监控摄像机和交通监控设备中都可以找到系统内跟踪的应用 。
  • 对象检测:对象检测与Computer Vision相关联 , 描述了一种可以识别图像中所需对象或物体的存在和位置的系统 。 请注意 , 要检测的对象可能有单个或多个出现 。
其他的还包括像神经网络 , 反向传播 , CNN网络架构 , 超分辨率 , 手势识别 , 语义分割等......
出于兴趣 , 我已经在边缘设备上合并了面部检测 , 手势识别 , 姿势估计和语义分割模型 。 在目前的职位上 , 我实践 , 训练和评估了许多深度学习模型 。 如果你想在先进的公司中使用大量前沿算法 , 工具 , 那么深度学习就是一个可以使您站在AI实用商业开发的最前沿的领域 。
论文
硕士学位论文的目的就是要利用在学习过程中获得的所有技能、知识和经验 , 为基于现实生活的问题设计解决方案 。
我写的是基于计算机视觉技术对四足动物进行运动分析 , 运动分析用到的是计算机视觉技术里面的姿势估计 。
这是我第一次被引入深度学习框架领域 。 我对运动分析的解决方案是基于卷积神经网络与深度学习的解决方案 。 在选择框架时 , 我曾在Caffe和Keras之间犹豫过 , 但由于PyTorch具有与任务相关的随时可用的预训练模型 , 所以我选择了PyTorch 。 Python是我选择的编程语言 。
这是我写完论文后学习到的内容:
  • 转移学习/微调
  • Python程式设计语言
  • C#编程语言
  • 姿势估计的理论
  • 有关如何使用Unity3D进行仿真
  • 使用Google Cloud Platform
在这里扩展说一下运动分析:
运动分析是指从清晰的运动图像中获取运动信息和细节 , 或代表序列到运动序列描述的图像排序 。 利用运动分析的应用程序和操作的结果以最直接的形式详细介绍了运动检测和关键点定位 。 复杂的应用程序允许利用顺序相关的图像逐帧跟踪对象 。
目前 , 运动分析及其各种应用形式在时间数据上使用时 , 可提供更多的信息 。 不同行业例如医疗保健、制造、机械、金融等行业 , 都在使用应用运动分析的方法来解决问题或为消费者创造价值 。
整个行业对于利用运动分析的多样性 , 已经间接引入了运动分析的各种子集 , 例如姿势估计、对象检测、对象跟踪、关键点检测以及其他不同子集 。


推荐阅读