非ChatGPT的14个大型语言模型( 二 )


6.Jasper
Jasper的创造者并不想创造一个聪明的多面手,他们想要的是一台专注于创造内容的聊天机器人 。该系统提供了50多个模板,而不仅仅是一个开放式的聊天会话,这些模板是为特定任务设计的,例如为亚马逊这样的网站制作房地产清单或编写产品功能 。其付费版本专门针对那些希望创建具有一致基调的营销文案的企业提供服务 。
7.Claude
Anthropic把Claude塑造成一个乐于助人的助手,它可以处理企业的许多基于文本的业务(从研究到客户服务),输入提示,输出答案 。Anthropic允许长提示来鼓励更复杂的指令,让用户对结果有更多的控制权 。Anthropic目前提供两个版本:一个是名为Claude-v1的完整模型,另一个是更便宜的简化模型Claude Instant,后者的价格要便宜得多 。第一种适用于需要更复杂、结构化推理的工作,而后者更快、更好地适用于分类和调节等简单任务 。
8.Cerebras
当专用硬件和通用模型共同发展时,最终可以得到一个非常快速和有效的解决方案 。Cerebras公司为那些想在本地运行它的用户提供了从小(1.11亿个参数)到大(130亿个参数)的各种Hugging Face大型语言模型 。然而,许多人想要使用云计算服务,这些服务运行在Cerebras公司自己的集成处理器上,该处理器针对大型训练集进行了优化 。
9.Falcon
全尺寸Falcon-40b和较小的Falcon-7b是由阿联酋的技术创新研究所(TII)建造的 。他们在RefinedWeb上的大量通用示例上训练了Falcon模型,重点是提高推理能力 。然后,他们将其与Apache 2.0一起发布,使其成为可用于实验的最开放和不受限制的大型语言模型之一 。
10.ImageBind
许多人认为Meta公司是一家主导社交媒体的大公司,但该公司也是一家开源软件开发商 。随着人们对人工智能的兴趣日益浓厚,该公司开始分享自己的许多创新成果也就不足为奇了 。ImageBind是一个旨在展示人工智能如何同时创建多种不同类型数据的项目;在这种情况下,包括文本、音频和视频 。换句话说,如果允许的话,生成人工智能可以将整个想象的世界整合在一起 。
11.Gorilla
人们可能听说过很多关于使用生成式人工智能编写代码的事情 。其结果往往表面上令人印象深刻,但仔细检查就会发现存在严重缺陷 。其语法可能是正确的,但是API调用都是错误的,或者它们甚至可能指向一个不存在的函数 。Gorilla是一个大型语言模型,它的设计是为了更好地处理编程接口 。它的创建者从Llama开始,然后对其进行微调,重点关注直接从文档中截取的更深层次的编程细节 。Gorilla的团队还提供了自己的以API为中心的测试成功基准集 。对于希望依靠人工智能进行编码协助的程序员来说,这是一个重要的补充 。
12.Ora.ai
Ora.ai是一个允许用户创建针对特定任务进行优化的目标聊天机器人的系统 。LibrarianGPT尝试用一本书中的段落来回答任何问题 。例如,聊天机器人可以从Carl Saga教授的所有著作中汲取灵感 。人们可以创建自己的聊天机器人,也可以使用其他人已经创建的数百个聊天机器人中的一个 。
13.AgentGPT
另一个将应用程序所需的所有代码整合在一起的工具是AgentGPT 。它的设计目的是创建代理,这些代理可以被派去处理诸如计划度假或编写某种游戏代码之类的工作 。大部分技术栈的源代码都可以在GPL3.0下获得 。还有一个正在运行的版本作为服务提供 。
14.FrugalGPT
FrugalGPT 并不是一个不同的模型,而是一种寻找价格更低的模型来回答特定问题的谨慎策略 。FrugalGPT的研究人员认识到,回答许多问题不需要更大、更昂贵的模型 。他们的算法从最简单的开始,在一系列大型语言模型中逐级移动,直到找到一个更好的答案 。研究人员的实验表明,这种谨慎的方法可以节省98%的成本,因为许多问题实际上并不需要采用复杂的模型 。
原文标题:14 LLMs that aren't ChatGPT,作者:Peter Wayner

【非ChatGPT的14个大型语言模型】


推荐阅读