文章插图
新智元报道
编辑:编辑部
【新智元导读】这个开源工具,居然能用GPT-4代替人类去标注数据,效率比人类高了100倍,但成本只有1/7 。
大模型满天飞的时代,AI行业最缺的是什么?毫无疑问一定是算(xian)力(ka) 。
老黄作为AI掘金者唯一的「铲子供应商」,早已赚得盆满钵满 。
文章插图
除了GPU,还有什么是训练一个高效的大模型必不可少且同样难以获取的资源?
高质量的数据 。OpenAI正是借助基于人类标注的数据,才一举从众多大模型企业中脱颖而出,让ChatGPT成为了大模型竞争中阶段性的胜利者 。
但同时,OpenAI也因为使用非洲廉价的人工进行数据标注,被各种媒体口诛笔伐 。
文章插图
时代周刊报道OpenAI雇佣肯尼亚廉价劳动力标注
而那些参与数据标注的工人们,也因为长期暴露在有毒内容中,受到了不可逆的心理创伤 。
文章插图
卫报报道肯尼亚劳工指责数据标注工作给自己带来了不可逆的心理创伤
总之,对于数据标注,一定需要找到一个新的方法,才能避免大量使用人工标注带来的包括道德风险在内的其他潜在麻烦 。
所以,包括谷歌,Anthropic在内的AI巨头和大型独角兽 , 都在进行数据标注自动化的探索 。
谷歌最近的研究,开发了一个和人类标注能力相近的AI标注工具
文章插图
Anthropic采用了Constitutional AI来处理数据,也获得了很好的对齐效果
除了巨头们的尝试之外 , 最近,一家初创公司refuel,也上线了一个AI标注数据的开源处理工具:Autolabel 。
文章插图
Autolabel:用AI标注数据,效率最高提升100倍
这个工具可以让有数据处理需求的用户 , 使用市面上主流的LLM(ChatGPT , Claude等)来对自己的数据集进行标注 。
文章插图
refuel称,用自动化的方式标注数据,相比于人工标注,效率最高可以提高100倍,而成本只有人工成本的1/7!
文章插图
就算按照使用成本最高的GPT-4来算,采用Autolabel标注的成本只有使用人工标注的1/7,而如果使用其他更便宜的模型 , 成本还能进一步降低
文章插图
采用Autolabel+LLM的标注方式之后 , 标注效率更是大幅提升
对于LLM标注质量的评估,Autolabel的开发者创立了一个基准测试,通过将不同的LLM的标注结果和基准测试中不同数据集中收纳的标准答案向比对,就能评估各个模型标注数据的质量 。
文章插图
当Autolabel采用GPT-4进行标注时,获得了最高的准确率——88.4%,超过了人类标注结果的准确率86.2% 。
而且其他比GPT-4便宜得多的模型的标注准确率,相比GPT-4来说也不算低 。
开发者称,在比较简单的标注任务中采用便宜的模型,在困难的任务中采用GPT-4,将可以大大节省标注成本,同时几乎不影响标注的准确率 。
Autolabel支持对自然语言处理项目进行分类,命名实体识别,实体匹配和问答 。
支持主流的所有LLM提供商:OpenAI、Anthropic 和 google Palm 等,并通过HuggingFace为开源和私有模型提供支持 。
用户可以尝试不同的提示策略,例如少样本和思维链提示 。只要简单更新配置文件即可轻松估计标签置信度 。
Autolabel免除了编写复杂的指南,无尽地等待外部团队来提供数据支持的麻烦,用户能够在几分钟内开始标注数据 。
可以支持使用本地部署的私有模型在本地处理数据,所以对于数据隐私敏感度很高的用户来说,Autolabel提供了成本和门槛都很低的数据标注途径 。
如何用AI进行评论有害性标注
所以,不论是律所想要通过GPT-4来对法律文档进行分类,还是保险公司想要用私有模型对敏感的客户医疗数据进行分类或者筛查,都可以使用Autolabel进行高效地处理 。
推荐阅读
- 陈小艺和肌肉萎缩的导演刘惠宁离婚,多年的感情就此终结
- 几款简单人工流产后食方
- 《人类简史》作者:人工智能可能灭绝人类,我们可能还有几年时间
- 谷歌掌门人畅谈AI:为何“动作慢了” 对人工智能有何担忧?
- 爱上AI伴侣,“AI情”是不是爱情?
- 榴莲是自己开口还是人工打开的口
- 三类Few-shot Learning的模型
- GPT-4写代码不如ChatGPT,误用率高达62%!加州大学两位华人开源代码可靠性基准RobustAPI
- 揭秘吃水果的20个误区
- 人工智能的“胡言乱语”,有没有解法?