您的当前位置:首页 > 知识 > 对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一 正文
时间:2024-12-25 00:14:07 来源:网络整理 编辑:知识
11月18日消息,日前,国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考
11月18日消息,对标代推第日前,布新国内人工智能公司月之暗面推出的理模Kimi国产大模型正式发布k0-math。
k0-math是型中Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,考高考考通过模拟人脑的研全思考和反思过程,大幅提升解决数学难题的对标代推第能力。
据了解,布新在多项数学基准能力测试中,理模k0-math的型中表现能对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。
根据官方公布的考高考考结果,在中考、研全高考、对标代推第考研以及包含入门竞赛题的布新MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型,理模拿下第一。
在业界最常使用的数学能力基准测试MATH 中,k0-math模型得分93.8,超过 o1-mini的90分和o1-preview的85.5分。
官方表示,k0-math这一成绩仅次于暂未开放使用的o1完全版94.8分。
据介绍,常规模型的设定目标是尽快提供问题的答案,但k0-math不同,k0-math模型在做题过程中会花更长的时间来推理,包括思考和规划思路,并且在必要时自行反思改进解题思路,提升答题的成功率。
不过,月之暗面坦言,k0-math虽然擅长解答大部分很有难度的数学题,但是当前版本还无法解答LaTeX格式难以描述的几何图形类问题。
另外,k0-math还有一些局限性需要突破,包括对于过于简单的数学问题,例如1+1等于几,k0-math模型可能会过度思考,对于高考难题和IMO题目依然有一定概率做错、猜答案。
月之暗面表示,这些局限性既是机遇,也是挑战,预计将在下一阶段的模型迭代中逐步得到改善。
《过山车大亨:经典版》12月5日登陆Switch平台2024-12-25 00:06
《半条命2 RTX》上架Steam 光追特效+4K效果2024-12-24 23:54
花钱看不了直播!爱奇艺体育致歉:补偿观赛券 免费看国足对日本比赛2024-12-24 23:46
神级反应😯马丁内斯再献顶级扑救,不愧是2届雅辛奖得主!2024-12-24 23:33
新能源汽车品牌单周销量榜:比亚迪8.77万辆蝉联销冠 能打五个特斯拉2024-12-24 23:32
攻克世界性难题!我国成功研发高放废物玻璃固化关键配方2024-12-24 23:20
[流言板]有点可惜!詹姆斯突破送妙传,浓眉关键时刻跟进上篮不进2024-12-24 22:50
曝小米15 Ultra 2月底登场:小米影像之王2024-12-24 22:05
拜仁vs美因茨图片报评分:李在城1分最高,金玟哉、戴尔6分最低2024-12-24 21:56
作为4粉,HS得做法我不理解, 更不接受!2024-12-24 21:42
[流言板]爱来自达拉斯!赛后小琼斯和欧文拥抱致意,两人交谈甚欢2024-12-25 00:11
中国信通院发布2025深度观察十大趋势2024-12-25 00:05
恐怖冒险游戏《尸体派对2:黑暗扭曲》Steam页面开放 明年发行2024-12-24 23:58
《明末:渊虚之羽》全新截图 鼓起勇气面对噩梦!2024-12-24 23:53
奇葩游戏人创业:会计转做网吧大神,用神器日入过万?2024-12-24 23:48
[流言板]德拉蒙德2次无球犯规被驱逐,随后裁判取消技犯前者返回球场2024-12-24 23:01
顽皮狗尼尔透露新项目已开发4年 何时公布由索尼决定2024-12-24 22:48
黑曜石《宣誓》系统配置要求公布 1070可玩2024-12-24 22:25
4J级巨无霸发车:京东官方智利车厘子45元/斤2024-12-24 22:21
[流言板]JackeyLove烬砍下11/4/12的战绩,拿下TES对阵IG次局MVP2024-12-24 21:33