MathGPT来了!专攻数学大模型,解题讲题两手抓( 二 )


所以 , 学而思选择在MathGPT方向发力也顺理成章 。
今年2月 , 学而思学习机上线AI讲题机器人小π 。
据了解 , 小π研发已有数年积累 , 研发方向主要为数学等领域的AI智能讲题能力 , 核心优势在于数理逻辑和运算 。
在实测中 , 当学而思学习机用户配套的AR镜识别到一道手写或者印刷的数学计算题时 , 小π机器人会对题目进行智能AI拆解分析 , 同时生成逻辑流畅、表达清晰的语言 , 将题目的解题方法讲解出来 。
该功能已覆盖的题目包括分数、小数等复杂计算 , 甚至一些“凑数、组合”的巧妙算法 , 已十分接近真人老师的解题效果 。

MathGPT来了!专攻数学大模型,解题讲题两手抓

文章插图
△同一道数学题目在ChatGPT(上)和小π(下)的解答对比
小π相关技术于2020年启动研发 , 以学而思超3亿的专业题库数据作为基础 , 经过了3年的数据训练和打磨迭代 。
另据了解 , 学而思学习机近期将会上线一款“AI助手” , 涵盖作文助手、口语助手、阅读助手、数学助手等相关功能 , 该AI产品将于5月11日开启内测 。
MathGPT的挑战和技术难题
如何利用大语言模型服务各行各业是当下社会的焦点问题 。
大模型的出现是对生产力和生产关系的改变 , 各行各业都会受到影响 , 并会在大模型的助力下完成转型升级 。
教育行业和大模型有着天然的契合点 。教育也是通过交流 , 把知识和信息传递给学生 , 大模型会让教育行业的数字化、智能化速度更快 。
比如在教育领域 , Duolingo、Quizlet、可汗学院等产品主要和OpenAI合作 , 在GPT大模型上做微调和接口调用 , 增强原有的产品体验 。
但也有一些领域如数学、医学等 , 对AI的需求是准确、清晰、具备强大的逻辑推理能力 , 且容错率低 , 通用LLM目前的性能表现还无法在上述领域取得突破 , 未来是否可能取得突破尚不清晰 。
MathGPT来了!专攻数学大模型,解题讲题两手抓

文章插图
以数学领域为例 , 目前市场上有几个主要流派 。
比如google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产品 , 主要利用非LLM的传统AI技术加上数据库的方式解决数学问题 。
走AGI路线的公司则尝试让通用LLM“更懂数学” , 比如GPT4在数学任务上比之前的3.5版本性能更好 , 谷歌旗下的Minerva模型也专门针对数学问题进行调优 。
学而思选择了另一条少有人走的路 , 不基于现有LLM做微调和接口调用、不做通用LLM , 而是自研基于专业领域的“数学大模型”MathGPT , 致力于打造自主、稳定、可持续、高质量的学习解决方案 。
学而思表示 , 乔布斯对电脑的定义是“思维的自行车” , MathGPT面向全球的数学爱好者 , 希望能成为学习数学、思考数学的“自行车” , 帮助人们更好的解决学习数学、思考数学的问题 。
长远看来 , 数学思维代表着理性逻辑 , 是“思维的体操” , 是一种基础能力 , 能够与很多行业产生关联 。
未来 , 也许每个人都是程序员 , 用自然语言就可以编程 , 创新想法 , 与人协作 , 创造新事物 , 但是用自然语言编程的好坏很大程度取决于是否经过数学思维的训练 。我们希望通过MathGPT , 帮助每个人更好地建立理性逻辑 , 从而终身成长 , 推动社会进步 。
在大语言模型不断进化的浪潮下 , 不同的技术路线选择孰优孰劣 , 仍有待讨论和验证 。
学而思自研独立的MathGPT大模型是否成立 , 是否能够超越通用模型在数学任务上的表现 , 是否更匹配不同人群的数学学习场景 , 这个问题还需要在创新实践中寻找答案 。
随着整个行业的深化发展和越来越多人才参与到这个领域 , 相信不久的将来就能看到更为成熟的解决方案 。

【MathGPT来了!专攻数学大模型,解题讲题两手抓】


推荐阅读