如果使用上面显示的默认超参数来训练模型,则会在 IMDb 电影评论分类数据集上产生以下性能:
- 训练准确率:92.15%
- 验证准确率:89.98%
- 测试准确率:89.44%
与传统微调方法的比较
在上一节中 , LoRA 在默认设置下获得了 89.44% 的测试准确率,这与传统的微调方法相比如何?
为了进行比较,本文又进行了一项实验,以训练 DistilBERT 模型为例 , 但在训练期间仅更新最后 2 层 。研究者通过冻结所有模型权重,然后解冻两个线性输出层来实现这一点:
文章插图
【如何从头开始编写LoRA代码,这有一份教程】只训练最后两层得到的分类性能如下:
- 训练准确率:86.68%
- 验证准确率:87.26%
- 测试准确率:86.22%
优化 LoRA 配置
前面讲到的结果都是 LoRA 在默认设置下进行的,超参数如下:
文章插图
假如用户想要尝试不同的超参数配置,可以使用如下命令:
文章插图
不过 , 最佳超参数配置如下:
文章插图
在这种配置下,得到结果:
- 验证准确率:92.96%
- 测试准确率:92.39%
原文链接:https://lightning.ai/lightning-ai/studIOS/code-lora-from-scratch?continueFlag=f5fc72b1f6eeeaf74b648b2aa8aaf8b6
推荐阅读
- 我国某高新企业遭境外网络勒索攻击,国安部发文谈如何防范
- 到底有没有必要分库分表,如何考量的
- 如何编写高性能的Java代码
- 如何自制草莓冰淇淋,如何制作草莓冰淇淋
- 应该怎么锁定ps中的图层,如何解锁PS CS6中的?图层
- 高德探路模式如何用 高德探路模式如何用语音唤醒
- 有什么方法能让头发快速生长 如何能让头发快速生长
- 知乎如何更换头像 知乎如何更换头像和名字
- 手机如何设置APP应用权限
- PS应该咋地才可以画弧线,如何在电脑上画出好看的弧线