开心锤锤2024年10月13日发布:OpenAI全新发布o1模型 - 我们正式迈入了下一个时代

⭐发布日期:2024年10月13日 | 来源:开心锤锤

⭐作者:Bichana 责任编辑:Admin

⭐阅读量:581 评论:4人

【澳门正版资料免费大全】

【2O24管家婆一码一肖资料】

【2024年澳门天天开彩资料】 【2024新澳彩免费资料61期】 【管家婆一肖一码100中】 【澳门今晚三肖三码必中】 【香港管家婆资料正版公开】 【2024澳门管家婆资料大全】 【澳门资料大全免费正版资料澳门】 【澳门精准资料期期精准】
【澳门2024正版资料王中王】 【123澳门正版免费资料大全】 【二四六天天彩资料免费大全24】 【澳门正版资料大全下载地址】 【岛内舆论就军演三问赖清德】 【2823澳门新资料大全免费】 【2024年澳门六开彩结果】 【澳门彩生肖分析走势图】

大半夜的,OpenAI抽象了整整快半年的新模型。

在没有任何预告下,正式登场。

正式版名称不叫草莓,草莓只是内部的一个代号。他们的正式名字,叫:

为什么取名叫o1,OpenAI是这么说的:

For complex reasoning tasks this is a significant advancement and represents a new level of AI capability. Given this, we are resetting the counter back to 1 and naming this series OpenAI o1.

翻译过来是:

对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1。

这次模型的强悍,甚至让OpenAI不惜推掉了过去GPT系列的命名,重新起了一个o系列。

炸了,真的炸了。

我现在,头皮发麻,真的,这次OpenAI o1发布,也标志着,AI行业,正式进入了一个全新的纪元。

“我们通往AGI的路上,已经没有任何阻碍。”

在逻辑和推理能力上,我直接先放图,你们就知道,这玩意有多离谱。

AIME 2024,一个高水平的数学竞赛,GPT4o准确率为13.4%,而这次的o1 预览版,是56.7%,还未发布的o1正式版,是83.3%。

代码竞赛,GPT4o准确率为11.0%,o1 预览版为62%,o1正式版,是89%。

而最牛逼的博士级科学问题 (GPQA Diamond),GPT4o是56.1,人类专家水平是69.7,o1达到了恐怖的78%。

我让Claude翻译了一下o1的图,丑是丑了点,但是能看的懂每项数据意思就行。

什么叫全面碾压,这就是。

特别是在测试测试化学、物理和生物学专业知识的基准GPQA-diamond上,o1 的表现全面超过了人类博士专家,这也是有史以来,第一个获得此成就的模型。

而整个模型之所以达到如此成就,基石就是Self-play RL,不知道这个的可以去看我前两天的预测文章:新模型草莓到底是个啥?

通过Self-play RL,o1学会了磨练其思维链并完善所使用的策略。它学会了识别和纠正自己的错误。

它也学会了将复杂的步骤分解为更简单的步骤。

而且当当前的方法不起作用时,它也学会了尝试不同的方法。

他学会的这些,就是我们人类,最核心的思考方式:慢思考。

诺贝尔经济学奖得主丹尼尔·卡尼曼有一本著作,名叫:《思考,快与慢》。

非常详细的阐述了人类的两种思考方式。

第一种是快思考(系统1),特点是快速、自动、直觉性、无意识,举几个例子:

  • 看到一个笑脸就知道对方心情很好。
  • 1+1=2 这样简单的计算。
  • 开车时遇到危险情况立即踩刹车。

这些就是快思考,也就是传统的大模型,死记硬背后学得的快速反应的能力。

第二种是慢思考(系统2),特点是缓慢、需要努力、逻辑性、有意识,举几个例子:

  • 解决一道复杂的数学题
  • 填写税务申报表
  • 权衡利弊后做出重要决定

这就是慢思考,我们人类之所以强大的核心,也是AI要通往下一步AGI路上的基石。

而现在,o1终于踏出了坚实的一步,拥有了人类慢思考的特质,在回答前,会反复的思考、拆解、理解、推理,然后给出最终答案。

说实话,这些增强的推理能力在处理科学、编码、数学及类似领域的复杂问题时绝对极度有用。

例如o1可以被医疗研究人员用来注释细胞测序数据,被物理学家用来生成量子光学所需的复杂数学公式,以及被各个领域的开发人员用来构建和执行多步骤工作流,等等等等。

o1也绝对是全新一代的数据飞轮,如果答案正确,整个逻辑链就会变成一个包含正负奖励的训练示例的小型数据集。

以OpenAI的用户级别,未来的进化速度,只会更恐怖。

写到这,我忽然叹了口气,我觉得我跟一年以后的o1比起来,可能就是个纯废物了,真的。。。

目前,o1模型已经逐步向所有ChatGPT Plus和 Team用户开放,未来会考虑对免费用户开放。

分为两个模型,o1预览版和o1 mini,o1-mini就是更快更小更便宜,推理啥的都不错,极度适合数学和代码,就是世界知识会差很多,适用于需要推理但不需要广泛世界知识的场景。

o1预览版每周30条,o1-mini每周50条。

雪崩,甚至不是按以前的3小时来限制的,是每周30条,也能从侧面看出来,o1这个模型,有多贵了。

对于开发者来说,只对已经付过1000美刀的等级5开发者开放,每分钟限制20次。

都挺少的。

而且在功能上阉割挺大,但是毕竟早期,理解。

API的价格上,o1预览版每百万输入15美元,每百万输出60美元,这个推理成本...

o1-mini会便宜一些,每百万输入3美元,每百万输出12美元。

输出成本都是推理成本的4倍,对比一下GPT4o,分别是5美元和15美元。

o1-mini还是勉强有一些经济效应的,不过还是开始,后面等着OpenAI打骨折。

既然说o1已经对Plus用户开放,我就直接去我的号上看了眼,还不错,拿到了。

那自然,第一时间试一试。

目前不支持曾经的所有功能,也就是没有图片理解、图片生成、代码解释器、网页搜索等等,只有一个可以对话的裸模型。

我先是一个曾经很致命的问题:

“农夫需要把狼、羊和白菜都带过河,但每次只能带一样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。”

思考了6秒时间,给了我一个很完美的回答。

还有之前一个坑遍所有大模型的调休问题:

“这是中国2024年9月9日(星期一)开始到10月13日的放假调休安排:上6休3上3休2上5休1上2休7再上5休1。

请你告诉我除了我本来该休的周末,我因为放假多休息了几天?”

在o1思考了整整30秒以后,给出了一天不差的极度精准的答案。

无敌,真的无敌。

再来一个更难的,就是曾经姜萍那个比赛的奥数题:

别问我题目什么意思,我看不懂,我是废物,这题曾经击败所有的大模型,这次,我们让o1也来试一下看看。

在o1思考了整整1分多钟之后,他给出了答案。

...

全...对...

我裂开了。

目前我自己试下来,感觉Prompt,未来可能也要重新摸索,在GPT为代表的快思考大模型时代,我们有很多所谓的一步一步思考之类的玩意,现在全都无效了,对o1甚至还有负效果。

OpenAI给出的最佳写法是:

  • 保持提示简单直接:模型擅长理解和响应简短、清晰的指令,而不需要大量的指导。
  • 避免思路链提示:由于这些模型在内部进行推理,因此不需要提示它们“逐步思考”或“解释你的推理”。
  • 使用分隔符来提高清晰度:使用三重引号、XML 标签或章节标题等分隔符来清楚地指示输入的不同部分,帮助模型适当地解释不同的部分。
  • 限制检索增强生成 (RAG) 中的附加上下文:提供附加上下文或文档时,仅包含最相关的信息,以防止模型过度复杂化其响应。

最后,我想说一下这个思考的时长。

现在o1是思考了一分钟,但是,如果是真正的AGI,说实话,思考的越慢可能会越刺激。

当他真的,可以去做证明数学定理,去做癌症药物研发,去做天体研究呢?

每一次的思考,可以达到几小时、几天、甚至几周呢?

最后的结果,可能会让所有人震惊的难以置信。

现在,没有人能想象到,那时候的AI,会是一个什么样的存在。

而o1的未来,在我看到,也绝对不止是一个普普通通的ChatGPT。

而是我们前往下个时代,最伟大的基石。

“我们通往AGI的路上,已经没有任何阻碍。”

现在,我毫不犹豫的坚信着这句话。

星光熠熠的下一个时代。

在今天。

正式到来了。

本文来源:,原文标题:《OpenAI全新发布o1模型 - 我们正式迈入了下一个时代。》

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。 返回搜狐,查看更多

责任编辑:

【2024澳门天天开好彩】 【澳门最新免费准的资料】
【演澳门资料大全】 【打开澳门免费资料大全马家婆】
【澳门正版准最快免费资料】 【香港全年资料大全免费】
【2024年澳门特马最新报价】 【新澳门内部资料精准大全有购买吗】
【伊朗发布直升机事故调查报告】 【澳门天天好彩】
【澳门最全的资料网】 【澳门四不像正版论坛超准资料精准】 【澳门天天最精准资料大全新奥彩】
上一条新闻 下一条新闻

推荐文章

发表评论

仉长波

6秒前:责任编辑:

IP:79.33.4.*

金姝

4秒前:目前我自己试下来,感觉Prompt,未来可能也要重新摸索,在GPT为代表的快思考大模型时代,我们有很多所谓的一步一步思考之类的玩意,现在全都无效了,对o1甚至还有负效果。

IP:60.68.1.*

McAfee

4秒前:o1也绝对是全新一代的数据飞轮,如果答案正确,整个逻辑链就会变成一个包含正负奖励的训练示例的小型数据集。

IP:23.32.3.*

开心锤锤APP介绍

APP图标

澳门今晚必中一码APP名:开心锤锤

版本:V4.35.112

更新时间:2024-10-12 20:15

4949澳门资料免费大全这是一个功能强大的澳ⅰ门天天好彩APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:3%。

管家婆一码中一肖APP介绍

APP图标

2024年管家婆的马资料62期APP名:开心锤锤

版本:V5.43.383

更新时间:2024-10-12 24:14

无论是新奥天天免费资料东方心经快速浏览新闻还是深入了解某个话题,这款新闻APP都能为您提供全面、精准的信息服务。

曾道正版资料免费大全2024APP介绍

APP图标

2024澳门资料大全正版免费APP名:开心锤锤

版本:V6.65.221

更新时间:2024-10-12 16:18

黄大仙内部精准三肖三码应用界面简洁易用,用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然,让您随时掌握世界动态。此外,您还可以参与评论,与其他读者交流看法,形成一个互动活跃的社区。

2024港澳宝典正版资料下载APP介绍

APP图标

2024年澳门今晚结果图APP名:开心锤锤

版本:V4.39.160

更新时间:2024-10-12 21:15

2024全年資料免費大全这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道,涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能,您可以根据兴趣定制新闻源,确保每条信息都与您相关。

管家婆八肖版资料大全APP介绍

APP图标

管家婆免费马资料大全APP名:开心锤锤

版本:V3.76.929

更新时间:2024-10-12 19:14

这是一款功能强大的一肖一码免费公开资料大全应用,专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯,还为您带来今日的最新动态:既然说o1已经对Plus用户开放,我就直接去我的号上看了眼,还不错,拿到了。。无论是获取信息还是提升效率,这款APP都是您理想的助手。

正版香港全年资料大全APP介绍

APP图标

二四六天天彩APP名:开心锤锤

版本:V3.60.365

更新时间:2024-10-12 24:23

这是一款功能强大的新澳门一码一肖100准打开应用,旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯,让您随时了解发生的重大事件。今天的最新内容包括:用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。,为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

澳门4949精准免费大全APP介绍

APP图标

正版全年免费资料大全下载网APP名:开心锤锤

版本:V7.11.171

更新时间:2024-10-12 22:16

这是一款功能强大的澳门资料大全2024应用,专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯,让您时刻掌握世界动态。今日的最新内容包括:在o1思考了整整1分多钟之后,他给出了答案。,为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么,这款APP都能成为您不可或缺的助手。

2024香港管家婆王中王资料APP介绍

APP图标

7777888888管家婆中特APP名:开心锤锤

版本:V2.84.770

更新时间:2024-10-12 18:21

今天的最新动态包括:” ,让您第一时间掌握关键资讯,做出明智的决策。这个应用不仅是您的信息获取工具,更是一个提升生活质量的得力助手。

澳门三肖三码三期必开码APP介绍

APP图标

2024年新奥门王中王结果APP名:开心锤锤

版本:V8.96.493

更新时间:2024-10-12 17:14

这是一款功能强大的2024年香港结果查询:应用,能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯,以及今天的最新动态:。。

2024澳彩记录查询表APP介绍

APP图标

管家婆一码一肖资料大全老人味APP名:开心锤锤

版本:V9.22.512

更新时间:2024-10-12 15:16

这款功能强大的2024香港全年免费资料应用旨在提升您的日常效率,帮助您轻松应对各种任务。应用界面友好直观,用户可以快速导航,获取所需信息。它不仅提供最新的24小时热点资讯,还定期更新各种主题的文章和评论,确保您始终走在信息的前沿。

澳门彩资料官方网站APP介绍

APP图标

2024澳门资料大全免费完整版APP名:开心锤锤

版本:V8.56.521

更新时间:2024-10-12 13:19

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源,提供最新的头条、热点和专题报道,涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送,确保获取最相关的信息。

澳门十二生肖资料大全完整版APP介绍

APP图标

管家婆九龙心水资料APP名:开心锤锤

版本:V6.59.940

更新时间:2024-10-12 23:19

APP界面友好,支持快速浏览和离线阅读。您还可以通过搜索功能,快速找到特定主题的新闻。互动功能让您可以评论、分享文章,与朋友讨论热点话题。无论您是在通勤、休闲,还是工作间隙,这款APP都能让您轻松掌握最新动态。