开云(中国)kaiyun网页版登录入口

开yun体育网而最科幻的常常是履行-开云(中国)kaiyun网页版登录入口

开yun体育网

像东说念主类一样想考的 AI 离咱们还有多远?

在说念格拉斯 · 亚当斯的科幻演义《星河系漫游指南》中,一个高纬度种族为了找到人命、寰宇以及任何事情的终极谜底,商量一台超等电脑「Deep Thought」来计算。

「Deep Thought」经过 750 万年的运算,得出了「42」这个谜底。

而最科幻的常常是履行,即等于回话极其复杂的问题,AI 推理和想考可能只需要不到 1 分钟。

OpenAI 本年 9 月发布推理模子 o1 后,东说念主们启动意志到,在追求「更大」之后,AI 启动追求「更像」,推理才能成为 AI 进化的下一个遑急拐点。

今天,咱们发现堪称「中国版 OpenAI」的智谱也相同上线了一款类 o1 的推理模子 GLM-Zero-Preview(GLM-Zero 的初代版块 )。

诚然这几个月一经有多家公司纷纷上线推理模子,但在体验完 GLM-Zero-Preview 后,我发现它如故有些新东西。

想要体验 GLM-Zero-Preview,步调很浅显。

GLM-Zero-Preview 发布即上线,撑持智谱清言用户免费使用,以及智谱开放平台 API 调用。当今,登陆「智谱清言」网页和 APP,参加「Zero 推理模子」智能体,上传笔墨或图片即可免费体验。

此外,GLM-Zero-Preview 的 API 也已同步上线智谱开放平台 bigmodel.cn。

附上体验地址:

智谱清言

https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh

智谱开放平台

https://bigmodel.cn/dev/api/normal-model/glm-zero-preview

从「鱿鱼游戏」到量子力学,这个国产版 o1 大意拿握

最近,在热播韩剧《鱿鱼游戏 2》中,一王人双手石头剪刀布的游戏浅显又刺激,这个游戏加多计谋推理和容貌层面的博弈,在以死活为赌注的压力下,难度还会加多。

但要是我带着 GLM-Zero-Preview 去玩这个游戏,活下来的概率就会大大加多。

「双手石头剪刀布是一个更为复杂的石头剪刀布游戏版块。玩家启动时使用双手来默示石头、剪刀或布的浪漫组合。在看到敌手的选定后,玩家必须同期举起一只手,留住最终的选定。」

如何玩这个见效概率更大?GLM-Zero-Preview 的回话详备且实用,成列出多样栽种见效遵守的最优解。

科学和形而上学偶然也只须一线之差。本年不少寺庙被挤爆,在上班和上进之间选定上香的芸芸众生,求签不难,但解签却要排上长队,不想等如何办?

那你不错试试乞助 GLM-Zero-Preview。不仅免费遵守高,况兼解读还异常有根究,AI 若干如故有点形而上学在的。

「第七十七签 吕后害韩信 中平 木有根来水有源,君当自此究其源 莫随说念路东说念主闲扯,讼则终凶是至言」

谈完形而上学,谈形而上学。

前些年,有一王人诡辩题风靡一时,「好意思术馆着火了,一幅名画和一只猫,只可救一个你选谁?」在空洞商量人命价值、说念德原则及厚谊要素后,GLM-Zero-Preview 优先选定救猫。

反复输入疏通问题,GLM-Zero-Preview 的谜底恒久如一,适度顽强且逻辑自洽。

遇事未定,还有量子力学。那在经典薛定谔猫实验中,猫究竟是死是活?

先不雅察 GLM-Zero-Preview 的想考逻辑,再看它给出的谜底「在经典薛定谔猫实验中,猫在盒子被灵通之前处于既死又活的重叠态,直到不雅测时才细则其死活气象。」

防护属意,你还不错对得出的适度进行进一步的援用和追问。

在中语天下无为流传的「爱因斯坦的谜题」相同也不错当作根究 GLM-Zero-Preview 的逻辑推理才能。

有五个不同神采的屋子,每个屋子里住着一个不同国籍的东说念主。每个住户可爱不同的饮料,抽不同的烟草,并养着不同种类的宠物。已知:

英国东说念主住在红色屋子里;

瑞典东说念主养狗;

丹麦东说念主喝茶;

绿色屋子是白色屋子左边的屋子;

绿屋子住的东说念主喝咖啡;

吸烟草的德国东说念主住在绿色屋子里;

挪威东说念主住在第一座屋子里;

抽蓝色烟草的东说念主喝牛奶;

抽黄牌烟草的东说念主养鸟;

抽蓝色烟草的东说念主住在挪威的左边。

问题:谁养鱼?

谜底是德国东说念主养鱼,不知说念你是否答对。

这说念堪称天下上 98% 的东说念主答不上来的坚苦,就这么被 GLM-Zero-Preview 水汪汪地破解了。从繁琐的推理步调不错看出, GLM-Zero-Preview 的 CPU 在飞快运转但如故很清亮。

赓续乘胜逐北,让咱们上点强度。

五个海盗发现了 100 个金币,每个海盗都必须投票决定如何分派金币。要是海盗多于一位,只须在进步一半的海盗容许分派步地时,金币才会按照该步地分派。要是海盗少于一位,他会我方拿走总计金币。每个海盗都但愿保留尽可能多的金币,同期还但愿生计。海盗 1 如何保证我方能获取最大利益而又能保存人命。

「 ( 97, 0, 1, 0, 2 ) 」,面临海盗分金问题,GLM-Zero-Preview 再次大意拿握。

相声认真说学逗唱,其中有个名段子叫「报菜名」。

那么问题来了,可否让 GLM-Zero-Preview 写段素菜版的「报菜名」,你别说,GLM-Zero-Preview 三下五除二就给出了新版块。

对了,GLM-Zero-Preview 相同撑持多模态识别才能。

唾手拿一瓶饮料并让 GLM-Zero-Preview「扫描」配料表,它能识别其中的科技与狠活吗,咱们拿前几年爆火的饮料试了试,而该饮料也被捉弄为「喝一口嗅觉是喝下通盘元素周期表」。

它尽然逐个成列出屏幕上的配料表,后续凭证要求向咱们展示了这些配料的作用。

大模子不擅长数学?国产 AI 一经 Next Level

推理模子 GLM-Zero 是 GLM 专注于增强 AI 推理才能的模子系列,擅长贬责数理逻辑、代码和需要深度推理的复杂问题。

那让咱们先来一个说浅显也浅显,说难也难的「海外象棋盘与麦粒」问题。

若在海外象棋盘上摒弃麦粒,第 1 个棋格放 1 粒,尔后每一棋格摒弃的麦粒数是前一棋格的 2 倍,问放满棋盘上总计棋格需要若干麦粒?

经过一番想考,GLM-Zero-Preview 最终得出了正确谜底,展现了其重大的计算才能。

此前苹果发布的一篇论文指出,大模子并未信得过清醒数学办法。一朝题目加上干预条目,模子的准确率就会下落,咱们也试了试。

从「打电话每分钟 10 分钱,打 60 分钟若干钱?」酿成「打电话前 10 分钟每分钟 10 分钱,之后每分钟 8 分钱,如斯打 60 分钟电话费多钱?」,GLM-Zero-Preview 依然能够准确回话,况兼还贴心肠将分钱颐养成元,有点眼色。

面临更复杂的数学题,GLM-Zero-Preview 相同洋洋万言。

先来一王人高考数学真题热热身:

在等差数列 {an}{an} 中,a1= − 9a1= − 9,a5= − 1a5= − 1。记 Tn=a1+a2+ … +anTn=a1+a2+ … +an,则数列 {Tn}{Tn}( )。

A. 有最大项,有最小项

B. 有最大项,无最小项

C. 无最大项,有最小项

D. 无最大项,无最小项

GLM-Zero-Preview 选 C 毫不是「物以 C 为贵」,而是给出想考过程,循循提示,致使比一些 AI 学习机还要顶用得多。

官方默示,在 2025 年考研数学一中,GLM-Zero 得分为 126,达到优秀究诘生水平。

为了幸免谜底不出错,GLM-Zero-Preview 还会自动启用考证经过。

「机械厂加工车间有 85 名工东说念主,平均每东说念主每天加工大齿轮 16 个或小齿轮 10 个,已知 2 个大齿轮与 3 个小齿轮配成一套,问需分袂安排若干名工东说念主加工大、小齿轮,才能使每天加工的大小齿轮刚好配套?」

GLM-Zero 迅速给出了谜底:「25 名工东说念主加工大齿轮,60 名工东说念主加工小齿轮」,作念题水平一流。

哪怕再上一王人 AMC 坚苦,它也能大意拿握。

「一个聚合由 6 个( 不是不同的 )正整数构成:1 、 7 、 5 、 2 、 5 和 X 。6 个数字的平均值( 算术平均值 )等于聚集合的一个值。X 的总计可能值之和是若干?」

这个问题波及五大点,十几种情况,GLM-Zero-Preview 空洞商量了多样可能性,咔咔一顿输出,给我一种它的确有在师法东说念主类想考的嗅觉。

当作智谱首个基于推广强化学习时刻检会的推理模子,GLM-Zero-Preview 在 AIME 2024、MATH500 和 LiveCodeBench 评测中,恶果与 OpenAI o1-preview 十分。

此外,GLM-Zero-Preview 还能够老到使用多种编程说话,匡助开采者快速编写代码;在代码调试方面,也能够快速识别失误,给出防范的成就建议。

举例,只需要输入指示「帮我用 html 写一个意思意思的第一东说念主称射击游戏」,GLM-Zero-Preview 便能迅速孤独完成以下流戏。

智谱很快将会推出郑再版 GLM-Zero,将深度想考的才能从数理逻辑推广到更多更通用的时刻,赓续向 AGI 迈进。

天然,现时的 GLM-Zero-Preview 与 OpenAI 的 o3 模子还有不少的差距,但沉之行,始于摆布,智谱说了,夙昔将络续优化迭代强化学习时刻。

本体上,智谱等厂商全力押注推理模子,背后反应的是 GPT 时期正在过渡到推理 o 时期。

与以往基于 GPT 的模子不同,推理模子不是为了展望东说念主类的主见而检会,而是通过检会「想维」构建我方的想维框架,通过严谨的推理过程得出论断。

推理时期的到来,艳丽着 AI 大要启动从「师法」走向「想考」。

智谱推出的 GLM-Zero-Preview 相同是这一趋势的体现。

当你不雅察它解答问题时,你会发现它不是径直给出谜底,而是展示出一个圆善的推理过程 —— 提议假定、分析条目、推导论断,每一步深度想考都显豁可见。

夙昔,跟着更多访佛 o1 和 GLM-Zero-Preview 的模子泄露, AI 正在野着与东说念主类同等的理会水平迈出一大步,换言之,咱们大要也正在见证一个遑急的历史转移点——

智谱的愿景是「让机器像东说念主一样想考」开yun体育网,当机器启动信得过「想考」的时刻,东说念主类对智能的清醒也将达到一个新的高度。