重大进步!OpenAI发布新推理模型,性能类似博士生

⭐发布日期:2024年09月23日 | 来源:澎湃

⭐作者:约翰·安德逊 责任编辑:Admin

⭐阅读量:764 评论:1人

【香港特马王资料内部公开】

【澳门精准资料今晚期期准】

【澳门六开彩资料查询最新2024】 【9494特准码资料大全】 【2024澳门免费精准资料】 【澳门今晚一肖码100准管家娶】 【香港二四六开彩资料大全302期】 【小孩手足口病吃什么好得快】 【澳门资料大全正版y资料查询】 【澳门今晚最快现场】
【2024澳彩管家婆资料传真】 【澳门今晚开什么号码】 【2024精准资料大全】 【2021年澳门天天彩资料大全3】 【4887澳门正版资料大全】 【48k.uk澳门记录】 【一肖一码100%-中】 【今晚精准一码一肖】

传言中有高级推理能力、此前被称为“草莓项目”的OpenAI新项目于北京时间9月13日凌晨推出了。

OpenAI在官网介绍,一个新的推理(reasoning)模型系列将开始提供,这个系列模型将用于解决困难问题,这些模型将在做出反应前花更多时间思考,可以通过复杂的过程进行推理,解决比以往更难的科学、编码和数据问题。OpenAI此次在ChatGPT和API接口渠道上先推出该系列的预览版本OpenAI o1-preview。

“对复杂的推理任务而言,这是一个重大进步,代表人工智能能力的一个崭新水平。因此我们将‘计数器’重置为1,新系列命名为OpenAI o1。”OpenAI表示。OpenAI CEO Sam Altman(萨姆·奥尔特曼)也在社交平台上表示,该新模型是一个新范式的开始,即AI能够进行通用复杂推理。

OpenAI o1包括三个型号,除o1-preview 之外还将有o1和o1-mini。其中o1-mini是一种更快、更便宜的推理模型且适用于需要推理但不需广泛世界知识的应用,o1-mini还比o1-preview便宜80%。

技术方面,OpenAI介绍,新系列模型经过训练,学会完善自身思维过程并尝试不同策略,能认识到自己的错误。新系列模型更新后的性能类似于博士生在物理、化学、生物学中完成具挑战性的基准任务。新系列模型还在数据和编码方面表现出色,在国际数学奥林匹克竞赛(IMO)的资格考试中得分83%,对比之下GPT-4o仅正确解决了13%的问题。新系列模型还在竞争性编程问题Codeforces比赛中排名前89%。

在技术研究相关文章中,OpenAI介绍,公司用大规模强化学习算法“教会”模型在数据高效训练时用思维链进行高效思考。随着强化学习增加和思考时间增加,o1的性能不断提高。类似于人类在回答困难问题之前思考很长时间,o1也尝试在解决问题时使用思维链,该模型通过强化学习学会磨练思维链并改进策略,学会在当前方法不起作用时尝试不同方法,这提高了模型推理能力。

“作为早期模型,它还难以使ChatGPT变得更加有用,例如通过浏览网页获取信息或上传文件和图像。对于很多常见案例,GPT-4o短期内能力还是更好。”OpenAI表示。不过该系列新模型增强的推理功能可能对解决科学、编码、数学和类似领域的复杂问题更有效,例如,医疗保健研究人员可用它来注释细胞测序数据,物理学家用它生成量子光学所需的复杂数学公式,开发人员可用它构建和执行多步骤工作流程。量子物理学者Mario Krenn就展示了GPT-4o不能回答但o1-preview正确完成计算的复杂量子物理问题。

OpenAI研究人员Noam Brown在社交平台上提到OpenAI o1系列的更多细节,他表示,o1系列经过强化学习训练,在通过自己的思维链做出反应前会思考,思考时间越长,推理任务表现越好。“这为大模型缩放(scaling)开辟了新维度,我们不再受预训练的瓶颈限制,现在也可以扩展推理计算了。” Noam Brown表示,但o1模型并不总是比GPT-4o好,有时人们不值得长时间等待o1响应,在个人写作和编辑文本时人们可能会偏好GPT-4o,在计算机编程、数据分析和数学计算领域则可能会偏好OpenAI o1。

Noam Brown透露,OpenAI o1在回答前会思考几秒,但OpenAI的目标是让未来的版本思考几个小时、几天甚至几周,虽然推理成本会更高,但人们有可能也会获得更多,例如在研发新抗癌药等方面,人工智能可以不仅仅是聊天机器人。

不过,不是所有用户都能立马用上新系列模型。据OpenAI介绍,ChatGPT Plus用户和Team用户最早可以在几个小时内体验到新模型。o1-preview限制为每周30条消息,o1-mini限制为每周50条消息。而从下周开始,ChatGPT的企业用户和教育(Edu)用户也可以访问这两种模型。该系列模型的API访问权限首先给Tier 5级用户。此外,OpenAI还计划将向所有ChatGPT免费用户提供o1-mini访问权限。后续,OpenAI还计划增加浏览、文件和图片上传等功能,且在OpenAI o1系列之外继续开发和发布GPT系列中的其他模型。

在安全方面,OpenAI则透露,新模型的思维链推理为确保对齐和安全提供了新的机会,隐藏的思维链为监控模型提供了独特的机会,使人能“读取模型思想”并理解其思维过程。此外,公司最近与美国和英国的人工智能安全研究所达成协议,开始将相关协议付诸实施,包括允许各机构尽早使用该模型的研究版本,这有助于建立一个在公开发布之前和之后对未来模型进行研究、评估和测试的流程。

栏目主编:秦红 文字编辑:程沛 题图来源:新华社 图片编辑:曹立媛

来源:作者:第一财经

【2024澳门天天开好彩大全免费】 【新澳天天开奖资料大全最新】
【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】
【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】
【2024全年资料免费大全】 【新澳天天开奖资料大全】
【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】
【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】 【正版澳门49资料图库改变世界】
上一条新闻 下一条新闻

推荐文章

发表评论

林茹萍

1秒前:对于很多常见案例,GPT-4o短期内能力还是更好。

IP:81.42.9.*

李心悦

8秒前:据OpenAI介绍,ChatGPT Plus用户和Team用户最早可以在几个小时内体验到新模型。

IP:69.30.6.*

广布道尔基

5秒前:栏目主编:秦红 文字编辑:程沛 题图来源:新华社 图片编辑:曹立媛 来源:作者:第一财经

IP:11.11.3.*

澎湃APP介绍

APP图标

新澳今天最新资料晚上出冷汗APP名:澎湃

版本:V7.29.333

更新时间:2024-09-22 14:15

2024澳门马今晚结果这是一个功能强大的天天彩澳门资料免费大全年APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:o1-preview限制为每周30条消息,o1-mini限制为每周50条消息。

澳门944c资料免费大全二四六APP介绍

APP图标

澳门一肖一码100%免费公开APP名:澎湃

版本:V2.79.341

更新时间:2024-09-22 15:16

4949澳门免费资料内容资料这是一个功能强大的全网最准确的澳门彩资料网APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:随着强化学习增加和思考时间增加,o1的性能不断提高。

澳门传真免费费资料APP介绍

APP图标

7777788888马会传真APP名:澎湃

版本:V5.79.543

更新时间:2024-09-22 13:21

2024澳门一肖一码一特中这是一个功能强大的澳门免费公开资料最准的资料APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:在安全方面,OpenAI则透露,新模型的思维链推理为确保对齐和安全提供了新的机会,隐藏的思维链为监控模型提供了独特的机会,使人能“读取模型思想”并理解其思维过程。

香港内部公开资料最准APP介绍

APP图标

澳门管家婆正版全年免费资料APP名:澎湃

版本:V5.14.743

更新时间:2024-09-22 23:13

澳门一肖一码100准确最准一这是一个功能强大的2024澳门资料免费大全APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:其中o1-mini是一种更快、更便宜的推理模型且适用于需要推理但不需广泛世界知识的应用,o1-mini还比o1-preview便宜80%。

澳门一肖码100准免费资料APP介绍

APP图标

新奥新澳门六结果资料查询APP名:澎湃

版本:V7.11.478

更新时间:2024-09-22 20:21

澳门最快最准的资料这是一个功能强大的管家婆一码一肖最经典的一句APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:新系列模型更新后的性能类似于博士生在物理、化学、生物学中完成具挑战性的基准任务。

澳门精准2024一肖一码APP介绍

APP图标

最准的一肖一码100%APP名:澎湃

版本:V1.27.141

更新时间:2024-09-22 13:13

管家婆一码中一肖更新中日期这是一个功能强大的小龙人期期准免费资料1887APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:不过,不是所有用户都能立马用上新系列模型。

澳门传真49正版4949APP介绍

APP图标

新澳门全年资料免费大全一APP名:澎湃

版本:V6.46.329

更新时间:2024-09-22 23:21

澳门王中王100这是一个功能强大的2024年澳门老鼠报APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:“作为早期模型,它还难以使ChatGPT变得更加有用,例如通过浏览网页获取信息或上传文件和图像。

2024今晚新澳六我奖51期APP介绍

APP图标

2024澳门管家婆资料大全玛丽APP名:澎湃

版本:V5.17.243

更新时间:2024-09-22 15:19

澳门一肖一码一这是一个功能强大的2024香港特马资料免费看APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:不过该系列新模型增强的推理功能可能对解决科学、编码、数学和类似领域的复杂问题更有效,例如,医疗保健研究人员可用它来注释细胞测序数据,物理学家用它生成量子光学所需的复杂数学公式,开发人员可用它构建和执行多步骤工作流程。