机器之心|一行代码不用写,就可以训练、测试、使用模型,这个项目帮你做到( 三 )


"""igel init possible optional args are: (notice that these args are optional, so you can also just run igel init if you want)-type: regression, classification or clustering-model: model you want to use-target: target you want to predictExample:If I want to use neural networks to classify whether someone is sick or not using the indian-diabetes dataset,then I would use this command to initliaze a yaml file:$ igel init -type "classification" -model "NeuralNetwork" -target "sick""""$ igel init
运行该命令之后 , 当前的工作目录中就有了一个 igel.yaml 文档 。 你可以检查这个文件并进行修改 , 也可以一切从头开始 。
机器之心|一行代码不用写,就可以训练、测试、使用模型,这个项目帮你做到
本文插图

在下面这个例子中 , 作者使用随机森林来判断一个人是否患有糖尿病 。 他用到的数据集是著名的「Pima Indians Diabetes Database」 。
# model definitionmodel:# in the type field, you can write the type of problem you want to solve. Whether regression, classification or clustering# Then, provide the algorithm you want to use on the data. Here I'm using the random forest algorithmtype: classificationalgorithm: RandomForest# make sure you write the name of the algorithm in pascal casearguments:n_estimators: 100# here, I set the number of estimators (or trees) to 100max_depth: 30# set the max_depth of the tree# target you want to predict# Here, as an example, I'm using the famous indians-diabetes dataset, where I want to predict whether someone have diabetes or not.# Depending on your data, you need to provide the target(s) you want to predict heretarget:- sick
注意 , 作者将 n_estimators 和 max_depth 传递给了模型 , 用作模型的附加参数 。 如果你不提供参数 , 模型就会使用默认参数 。 你不需要记住每个模型的参数 。 相反 , 你可以在终端运行 igel models 进入交互模式 。 在交互模式下 , 系统会提示你输入你想要使用的模型以及你想要解决的问题的类型 。 接下来 , Igel 将展示出有关模型的信息和链接 。 通过该链接 , 你可以看到可用参数列表以及它们的使用方法 。
igel 的使用方式应该是从终端(igel CLI):
在终端运行以下命令来拟合 / 训练模型 , 你需要提供数据集和 yaml 文件的路径 。
$ igel fit --data_path 'path_to_your_csv_dataset.csv' --yaml_file 'path_to_your_yaml_file.yaml'
# or shorter
$ igel fit -dp 'path_to_your_csv_dataset.csv' -yml 'path_to_your_yaml_file.yaml'"""That's it. Your "trained" model can be now found in the model_results folder(automatically created for you in your current working directory).Furthermore, a description can be found in the description.json file inside the model_results folder."""
机器之心|一行代码不用写,就可以训练、测试、使用模型,这个项目帮你做到
本文插图

接下来 , 你可以评估训练 / 预训练好的模型:
$ igel evaluate -dp 'path_to_your_evaluation_dataset.csv'"""This will automatically generate an evaluation.json file in the current directory, where all evaluation results are stored"""
机器之心|一行代码不用写,就可以训练、测试、使用模型,这个项目帮你做到
本文插图

如果你对评估结果比较满意 , 就可以使用这个训练 / 预训练好的模型执行预测 。


推荐阅读