机器之心|一行代码不用写,就可以训练、测试、使用模型,这个项目帮你做到( 二 )
split:# split optionstest_size: 0.2#[float] -> 0.2 means 20% for the test data, so 80% are automatically for trainingshuffle: true# [bool] -> whether to shuffle the data before/while splittingstratify: None# [list, None] -> If not None, data is split in a stratified fashion, using this as the class labels.
preprocess: # preprocessing optionsmissing_values: mean# [str] -> other possible values: [drop, median, most_frequent, constant] check the docs for moreencoding:type: oneHotEncoding# [str] -> other possible values: [labelEncoding]scale:# scaling optionsmethod: standard# [str] -> standardization will scale values to have a 0 mean and 1 standard deviation| you can also try minmaxtarget: inputs# [str] -> scale inputs. | other possible values: [outputs, all] # if you choose all then all values in the dataset will be scaled
# model definitionmodel:type: classification# [str] -> type of the problem you want to solve. | possible values: [regression, classification, clustering]algorithm: NeuralNetwork# [str (notice the pascal case)] -> which algorithm you want to use. | type igel algorithms in the Terminal to know morearguments:# model arguments: you can check the available arguments for each model by running igel help in your terminaluse_cv_estimator: false# [bool] -> if this is true, the CV class of the specific model will be used if it is supportedcross_validate:cv: # [int] -> number of kfold (default 5)n_jobs:# [signed int] -> The number of CPUs to use to do the computation (default None)verbose: # [int] -> The verbosity level. (default 0)
# target you want to predicttarget:# list of strings: basically put here the column(s), you want to predict that exist in your csv dataset- put the target you want to predict here- you can assign many target if you are making a multioutput prediction
这款工具具备以下特性:
支持所有机器学习 SOTA 模型(甚至包括预览版模型);
支持不同的数据预处理方法;
既能写入配置文件 , 又能提供灵活性和数据控制;
支持交叉验证;
支持 yaml 和 json 格式;
支持不同的 sklearn 度量 , 进行回归、分类和聚类;
支持多输出 / 多目标回归和分类;
在并行模型构建时支持多处理 。
如前所示 , igel 支持回归、分类和聚类模型 , 包括我们熟悉的线性回归、贝叶斯回归、支持向量机、Adaboost、梯度提升等 。
本文插图
igel 支持的回归、分类和聚类模型 。
快速入门
为了让大家快速上手 igel , 项目作者在「README」文件中提供了详细的入门指南 。
运行以下命令可以获取 igel 的帮助信息:
$ igel --help
# or just
$ igel -h"""Take some time and read the output of help command. You ll save time later if you understand how to use igel."""
本文插图
第一步是提供一份 yaml 文件(你也可以使用 json) 。 你可以手动创建一个. yaml 文件并自行编辑 。 但如何你很懒 , 也可以选择使用 igel init 命令来快速启动:
推荐阅读
- Live800|智能客服机器人是否可替代人工客服?解决机器人智能化痛点,Live800智能套电机器人有这些优势:解决机器人营销痛点,Live800智能套电机器人有这些
- 山西君和文悦|工业机器人发展史
- 避障|解决扫地机器人的避障难题 石头 T7 Pro 是怎样做到的?
- 营协|市营协周新刚一行深入耀新科技公司考察调研
- |加速冲刺世界级技术领先地位,大族机器人获1.65亿元A轮融资
- 投资|AI机器视觉技术及产品研发商“感图科技”完成A轮融资,熠美投资领投
- 智能机器人|碳纤维牙叉有哪些使用优势?
- 机器人|智能机器人厂商大族机器人完成了1.65亿元A轮融资
- 机器人|加速冲刺“世界级”技术领先地位,大族机器人获1.65亿元A轮融资
- 智能机器人|工业制造业的未来——一批具有影响力的新技术