天天实时:学而思研发面向全球数学爱好者大模型MathGPT
时间:2023-05-05 18:18:26来源:财经网

面向全球数学爱好者和科研机构,计划于年内推出

据了解,学而思正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。


(资料图片)

据悉,学而思已将MathGPT作为公司核心项目,由CTO田密负责,今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。

MathGPT与大语言模型(LLM)的差异

美国OpenAI公司在今年三月份发布了大语言模型GPT-4,国内百度、阿里也发布了各自的大模型产品,但通用语言模型更像一个“文科生”,在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在明显不足:解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配。

“这种不足是由LLM模型的自身特点决定的。”学而思AI团队负责人介绍,LLM大模型来自对海量语言文本的训练,因此最擅长语言处理。行业内偏向基于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。因此,学而思决心组建团队专研MathGPT——数学领域大模型,用自己在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。

学而思希望通过MathGPT弥补和攻克大语言模型的三个问题:第一,题目要解对,现在GPT结果经常出现错误;第二,解题步骤要稳定、清晰,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;第三,解题要讲的有趣、个性化,现在GPT的解释过于“学术”和机械,对孩子的学习体验很不友好。

做MathGPT,学而思凭什么

学而思作为获国家科技部批准的“智慧教育国家新一代人工智能开放创新平台”建设单位,也是教育行业唯一一家人工智能“国家队”成员,在人工智能领域有着多年的深入研究,早在2017年,学而思便成立了AI lab 人工智能实验室。

据公开信息显示,基于智慧教育人工智能开放创新平台助力,学而思AI lab获得各类顶级学术会议比赛冠军16项,亚军6项;发表国际期刊和会议高水平学术论文31篇,包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究,在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;申请专利220余项,授权专利150余项,软件著作权60余项。

学而思AI lab在各类顶级学术会议比赛获奖情况

“以数学起家”的学而思至今已有20年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行MathGPT训练的必备物料。另外,学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的IMO和AMC等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。所以,学而思选择在MathGPT方向发力也顺理成章。

另据了解,学而思学习机近期将会上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。

MathGPT的挑战和技术难题

如何利用大语言模型服务各行各业是当下社会的焦点问题。比如在教育领域,Duolingo、Quizlet、可汗学院等产品主要和OpenAI合作,在GPT大模型上做微调和接口调用,增强原有的产品体验。但也有一些领域如数学、医学等,对AI的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用LLM目前的性能表现还无法在上述领域取得突破,未来是否可能取得突破尚不清晰。

以数学领域为例,目前市场上有几个主要流派。比如Google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产品,主要利用非LLM的传统AI技术加上数据库的方式解决数学问题。走AGI路线的公司则尝试让通用LLM“更懂数学”,比如GPT4在数学任务上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也专门针对数学问题进行调优。学而思选择了另一条少有人走的路,不基于现有LLM做微调和接口调用、不做通用LLM,而是自研基于专业领域的“数学大模型”MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。

在大语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。学而思自研独立的MathGPT大模型是否成立,是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。随着整个行业的深化发展和越来越多人才参与到这个领域,相信不久的将来就能看到更为成熟的解决方案。

标签:

最新
  • 天天实时:学而思研发面向全球数学爱好者大模型MathGPT

    面向全球数学爱好者和科研机构,计划于年内推出据了解,学而思正在进行自研数学大模型的研发,命名为MathGP

  • 天天观察:360文档快看怎么再次关联_360文档快看怎么解除

    1、你可以在360软件管家中直接删除的要是使用的是360安全浏览器也可以直接在浏览器里面删除直接卸载软件即

  • 工伤伤残鉴定申请书怎样写?因工致残被鉴定为一级至四级伤残有补助金吗?

    工伤伤残鉴定申请书怎样写工伤伤残鉴定申请书首先应该注明受害者的信息,主要包括姓名、姓别、年龄,受

  • 草莓能放冰箱冷藏多久不会坏?草莓不放冰箱可以存放过夜吗?

    草莓能放冰箱冷藏多久不会坏不超过3天。草莓本身就富含较多水分,所以需要存放在冰箱等低温环境才能保存

  • 住房公积金交多与交少的有什么区别?公积金缴纳比例高低有什么影响?

    住房公积金交多与交少的有什么区别?公积金额度不一样,从而影响日后贷款额度以及可提取的额度公积金缴纳

  • 购买宽基需要注意些什么?怎么看基金是宽基还是窄基?

    购买宽基需要注意些什么?1、投资时间选择短线投资的投资者建议及时对股票的走势以及风险进行判断。选择

  • 理想发布“双能战略” 2025年建成3000座以上 你知道吗?

    理想发布双能战略,800V高压下半年将上市在4月上海车展,目前销量最火的新势力品牌—理想发布了双能战略

  • 网上可以交易股票吗?股票转户能从网上转吗?

    网上可以交易股票吗?携带身份证到证券公司开办证券账户,绑定银行卡,签订第三方存管协议。用银行指定

  • 每日讯息!应用持续拓宽,机器视觉带来“解题”新思路

    如果把生产制造比作人体,那么机器视觉就是火眼金睛。在生产制造业中,机器视觉技术被广泛应用于一些不适合人工作业的危险工作环境或人工视

  • 环球百事通!9年稳居全球第一!我国工业机器人市场再创辉煌战绩

    【资料图】据悉,我国已经连续9年成为全球最大的工业机器人消费国,稳居全球第一大工业机器人市场。近日,我国工业机器人产业发展又迎来好

  • 每日动态!物联网技术赋能多智慧楼宇、物业管理等发展

    建筑和人体一样,是个复杂而有生命的系统。建筑的楼宇自控系统相当于人体的神经系统;建筑结构相当于骨骼系统;给水系统相当于循环系统;通风

  • 每日快讯!锂矿企业利润大涨,电池厂商向上游进发

    (相关资料图)业内普遍认为锂产品价格短期内将维持稳涨趋势。随着新能源汽车保有量的不断增长,动力电池行业迎来了新的发展契机。宁德时代、

  • 【全球报资讯】物联网技术给我们的生产生活带来了好处!

    国内首个“云保险鱼塘”长啥样?近日,记者实地进行了探访。在广东省肇庆市四会市国斌水产养殖合作社,记者见到了合作社带头人马国斌。刚刚

  • 【世界热闻】方案分享 - 纸箱折耳机

    背景介绍作为应用最广泛的包装用品之一,纸箱承担着容装、保护产品、美观的重要责任。其市场需求也随着国内消费、物流运输及出口包装行业的

  • 天天通讯!喜讯!ABB高压电机有限公司研发中心荣获“上海市政府外资研发中心认证”!

    【资料图】ABB高压电机有限公司研发中心作为ABB电机业务全球研发的重要组成部分,从建成伊始起,就始终致力于“在中国,为中国和世界”作为

  • 天天亮点!喜讯!正弦电气荣获国家级专精特新“小巨人”企业

    近日,深圳市国家级专精特新"小巨人"企业名单公布,正弦电气成功入选国家级专精特新"小巨人"企业名单。S I N E E专精特新“小巨人”专