MathGPT来了!专攻数学大模型,解题讲题两手抓


MathGPT来了!专攻数学大模型,解题讲题两手抓

文章插图
允中 发自 凹非寺
量子位 | 公众号 QbitAI
大模型领域又来新玩家 。
据了解 , 学而思正在进行自研数学大模型的研发 , 命名为MathGPT 。
面向全球数学爱好者和科研机构 , 以数学领域的解题和讲题算法为核心 。
目前已经取得阶段性成果 , 并将于年内推出基于该自研大模型的产品级应用 。
据悉 , 学而思已将MathGPT作为公司核心项目 , 由CTO田密负责 。
今年春节前 , 该项目已经启动相应的团队建设、数据、算力准备和技术研发 。
此外 , 学而思已经启动在美国硅谷的团队建设 , 将成立一支海外算法和工程团队 , 在全球范围内招募优秀的人工智能专家加入 。
MathGPT与大语言模型(LLM)的差异
OpenAI在今年三月份发布了大语言模型GPT-4 , 国内百度、阿里也发布了各自的大模型产品 , 但通用语言模型更像一个“文科生” , 在语言翻译、摘要、理解和生成等任务上有出色表现 , 在数学问题的解决、讲解、问答和推荐方面则存在明显不足:
解答数学问题经常出错 , 有些数学问题虽然能够解决 , 但方法更偏成年人 , 无法针对适龄孩子的知识结构和认知水平做适配 。
MathGPT来了!专攻数学大模型,解题讲题两手抓

文章插图
“这种不足是由LLM模型的自身特点决定的 。”
学而思AI团队负责人介绍 , LLM大模型来自对海量语言文本的训练 , 因此最擅长语言处理 。
行业内偏向基于LLM大模型做阅读、写作类应用 , 但如果想要在数学能力上有突破 , 就需要研发新的大模型 。
因此 , 学而思决心组建团队专研MathGPT——数学领域大模型 , 用自己在数学和AI上的多年积累 , 面向全球范围内的数学爱好者和科研机构 , 做好AI大模型时代的数学基础工作 。
学而思希望通过MathGPT弥补和攻克大语言模型的三个问题:
第一 , 题目要解对 , 现在GPT结果经常出现错误;
第二 , 解题步骤要稳定、清晰 , 现在GPT的解题步骤每次都不一样 , 而且生成内容经常很冗余;
第三 , 解题要讲的有趣、个性化 , 现在GPT的解释过于“学术”和机械 , 对孩子的学习体验很不友好 。
为了实现这些目标 , MathGPT将结合大语言模型和计算引擎两者的能力 , 大语言模型负责理解题目、分步解析 , 并在合适的步骤自行调用计算引擎 , 这样能提高题目解答正确率 。
基于海量名师解题过程的数据进行模型训练 , 模型的解题步骤可以更加清晰 。
再引入优秀老师的教学理念和方法 , 模型在解题趣味性上也能进一步提高 。
据透露 , MathGPT将先从中小学数学做起 , 逐步覆盖全年龄学段和解题种类 。
做MathGPT , 学而思凭什么
学而思作为获国家科技部批准的“智慧教育国家新一代人工智能开放创新平台”建设单位 , 也是教育行业唯一一家人工智能“国家队”成员 , 在人工智能领域有着多年的深入研究 。
早在2017年 , 学而思便成立了AI lab 人工智能实验室 。
据公开信息显示 , 基于智慧教育人工智能开放创新平台助力 , 学而思AI lab获得各类顶级学术会议比赛冠军16项 , 亚军6项;
发表国际期刊和会议高水平学术论文31篇 , 包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究 , 在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;
申请专利220余项 , 授权专利150余项 , 软件著作权60余项 。
MathGPT来了!专攻数学大模型,解题讲题两手抓

文章插图
△学而思AI lab在各类顶级学术会议比赛获奖情况
“以数学起家”的学而思至今已有20年的数学教学经验 , 积累了庞大的数学相关数据 , 这些数据是进行MathGPT训练的必备物料 。
另外 , 学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢 , 学而思的学生在每年的IMO和AMC等国际数学竞赛中表现优异 , 每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌 。


推荐阅读