机器之心|一行代码不用写,就可以训练、测试、使用模型,这个项目帮你做到( 四 )
$ igel predict -dp 'path_to_your_test_dataset.csv'"""This will generate a predictions.csv file in your current directory, where all predictions are stored in a csv file"""
本文插图
本文插图
你可以使用一个「experiment」命令将训练、评估和预测结合到一起:
$ igel experiment -DP "path_to_train_data path_to_eval_data path_to_test_data" -yml "path_to_yaml_file""""This will run fit using train_data, evaluate using eval_data and further generate predictions using the test_data"""
本文插图
当然 , 如果你想写代码也是可以的:
交互模式
交互模式是 v0.2.6 及以上版本中新添加的 , 该模式可以让你按照自己喜欢的方式写参数 。
也就是说 , 你可以使用 fit、evaluate、predict、experiment 等命令而无需指定任何额外的参数 , 比如:
igel fit
如果你只是编写这些内容并点击「enter」 , 系统将提示你提供额外的强制参数 。 0.2.5 及以下版本会报错 , 所以你需要使用 0.2.6 及以上版本 。
本文插图
本文插图
如 demo 所示 , 你不需要记住这些参数 , igel 会提示你输入这些内容 。 具体而言 , Igel 会提供一条信息 , 解释你需要输入哪个参数 。 括号之间的值表示默认值 。
端到端训练示例
项目作者给出了使用 igel 进行端到端训练的完整示例 , 即使用决策树算法预测某人是否患有糖尿病 。 你需要创建一个 yaml 配置文件 , 数据集可以在 examples 文件夹中找到 。
拟合 / 训练模型:
model:type: classificationalgorithm: DecisionTree
target:- sick
$ igel fit -dp path_to_the_dataset -yml path_to_the_yaml_file
现在 , igel 将拟合你的模型 , 并将其保存在当前目录下的 model_results 文件夹中 。
评估模型:
现在开始评估预训练模型 。 Igel 从 model_results 文件夹中加载预训练模型并进行评估 。 你只需要运行 evaluate 命令并提供评估数据的路径即可 。
$ igel evaluate -dp path_to_the_evaluation_dataset
Igel 进行模型评估 , 并将 statistics/results 保存在 model_results 文件夹中的 evaluation.json 文件中 。
预测:
这一步使用预训练模型预测新数据 。 这由 igel 自动完成 , 你只需提供预测数据的路径即可 。
$ igel predict -dp path_to_the_new_dataset
Igel 使用预训练模型执行预测 , 并将其保存在 model_results 文件夹中的 predictions.csv 文件中 。
高阶用法
你还可以通过在 yaml 文件中提供某些预处理方法或其他操作来执行它们 。 关于 yaml 配置文件请参考 GitHub 详细介绍 。 在下面的示例中 , 将数据拆分为训练集 80% , 验证 / 测试集 20% 。 同样 , 数据在拆分时会被打乱 。
此外 , 可以通过用均值替换缺失值来对数据进行预处理:
# dataset operationsdataset:split:test_size: 0.2shuffle: Truestratify: default
preprocess: # preprocessing optionsmissing_values: mean# other possible values: [drop, median, most_frequent, constant] check the docs for moreencoding:type: oneHotEncoding# other possible values: [labelEncoding]scale:# scaling optionsmethod: standard# standardization will scale values to have a 0 mean and 1 standard deviation| you can also try minmaxtarget: inputs# scale inputs. | other possible values: [outputs, all] # if you choose all then all values in the dataset will be scaled
推荐阅读
- Live800|智能客服机器人是否可替代人工客服?解决机器人智能化痛点,Live800智能套电机器人有这些优势:解决机器人营销痛点,Live800智能套电机器人有这些
- 山西君和文悦|工业机器人发展史
- 避障|解决扫地机器人的避障难题 石头 T7 Pro 是怎样做到的?
- 营协|市营协周新刚一行深入耀新科技公司考察调研
- |加速冲刺世界级技术领先地位,大族机器人获1.65亿元A轮融资
- 投资|AI机器视觉技术及产品研发商“感图科技”完成A轮融资,熠美投资领投
- 智能机器人|碳纤维牙叉有哪些使用优势?
- 机器人|智能机器人厂商大族机器人完成了1.65亿元A轮融资
- 机器人|加速冲刺“世界级”技术领先地位,大族机器人获1.65亿元A轮融资
- 智能机器人|工业制造业的未来——一批具有影响力的新技术