文旅中国2024年10月11日发布:OpenAI发布首款具有推理能力的模型o1,可“思考”后自我核实答案正确性

⭐发布日期:2024年10月11日 | 来源:文旅中国

⭐作者:米内佑希 责任编辑:Admin

⭐阅读量:183 评论:2人

【澳门一码一肖100%精准开奖结果今晚】

【澳门六开彩天天正版免费资料大全】

【澳门二四六天天资料大全2024】 【新奥天天免费资料】 【2024澳门特马今晚06期最新开奖记录】 【新澳门精准免费资料查看】 【澳彩资料免费的资料大全wwe】 【澳门正版免费全年资料大全问你】 【澳门六开彩资料查询最新2024年网站开奖记录查询】 【二四六好彩7777788888开奖结果记录】
【一肖一码100%澳门开奖结果查询】 【新澳门资料免费资料大全】 【澳门王中王100%的资料论坛】 【香港二四六免费资料唯美图库】 【澳门四不像正版资料大全部】 【新澳彩资料免费资料大全33图库】 【澳门管家婆一肖一码一中一开奖历史记录】 【澳门资料大全开奖结果记录】

本文作者:杜玉

来源:硬AI

OpenAI旗下首款具有推理能力的AI大语言模型加速袭来。

两天前,尚有消息称代号为“草莓”的推理功能模型预计在两周内发布,9月12日周四,这款模型已经以“OpenAI o1”(英文字母O+阿拉伯数字1)的正式名称发布了。

不过,作为o1系列模型的首批版本,OpenAI仅推出了o1-preview预览版和o1-mini迷你版,而且是分阶段向付费用户、免费用户和开发者推出,且开发者的使用价格颇为昂贵。

o1模型使用成本至少是GPT-4o的3倍,初始发送信息数有限,采用全新方法训练

据介绍,o1新模型通过背后崭新的训练方式,变得可以回答更复杂的编程、数学与科学难题,在给出答案前会先“思考”,而且速度比人类更快。更小、更便宜的迷你版聚焦在编程用例。

ChatGPT Plus和Team付费用户即刻起便能访问这两种模型,从用户界面AI模型选择器的下拉菜单中手动选择。ChatGPT Enterprise和Edu用户下周能使用这两种模式,未来某个未知时刻还将向所有免费用户提供o1-mini的访问权限。OpenAI希望以后能根据提示语自动选择正确的模型。

不过,开发人员访问o1非常昂贵,在API(应用程序编程接口)中,o1-preview每100万个输入token收费15美元,是GPT-4o成本的三倍,每100万个输出token收费60美元,是GPT-4o成本的四倍。100万个token即模型解析文字块的规模大小,相当于大约75万个单词。

OpenAI的研究负责人Jerry Tworek对媒体称,o1背后的训练方式与之前的模型有着根本不同。

首先,o1“使用了一种全新的优化算法和专门为其量身定制的新训练数据集进行训练”,这个数据集中包含“推理数据”和专门为其量身定制的科学文献。

其次,之前的GPT模型训练方法是模仿数据集的规律/范式(pattern),而o1采用“强化学习”的方式,通过奖励和惩罚来教导模型自行解决问题,再通过“思路链”(chain of thoughts)来处理用户查询的问题,给出思路链的总结摘要版,类似于人类一步步来处理问题的方式。

OpenAI认为,这种全新的训练方法会让o1模型更加准确,会减少瞎编回答的“幻觉”问题,但也无法完全杜绝出现“幻觉”。新模型与GPT-4o的主要区别在于能够更好地解决编程和数学等复杂问题,同时还能完善其推理过程、尝试不同策略,并识别和修正自身答案中的错误。

优势:对复杂的推理任务是重大进步,思考越久质量越高,安全性提升,展现思考步骤

在优势方面,OpenAI称o1模型对于复杂的推理任务来说是个重大进步,代表了人工智能能力的新水平,而且模型“思考”的时间越长,在推理任务上的表现就越好,因为o1可以花更多时间来考虑一个复杂问题的所有部分,从而有效地进行事实核查。

具体来说,o1模型的推理能力大幅提升,在物理、化学和生物等学科的Challenging基准测试中表现与博士生(即专家型人才)相当。而且其数学和编程能力爆表,在一项国际奥数竞赛(IMO)的资格考试中正确率高达83%,GPT-4o的正确率只有13%,在Codeforces在线编程竞赛中的成绩也高达89百分位,即前头只有11%的人类选手比o1模型出色。

同时,o1模型的安全性得以提升,比之前模型更能遵守安全准则,并且更能抵抗产生有害内容。在用户试图绕过安全规则的“越狱测试”中,在最严格的标准下GPT-4o在百分之中仅得22分,o1预览版的分数却高达84。公司称其“没有促进超过现有资源已经可能实现的评估风险。”

公司称,适用人群包括“正在解决科学、编程、数学和类似领域复杂问题的人士”,这些增强的推理能力可能特别有用。o1模型擅长准确生成和调试复杂代码,迷你版是款速度更快、比预览版便宜80%的推理模型,在编程方面尤其高效,适用于需要推理但不需要广泛世界知识的应用程序:

“例如,医疗研究人员可以使用o1来注释细胞测序数据,物理学家可以使用o1来生成量子光学所需的复杂数学公式,各领域的开发人员可以使用o1来构建和执行多步骤工作流程。”

测试过该模型的汤森路透副总裁Pablo Arredondo还发现,在分析法律摘要和解决LSAT(法学院入学考试)的逻辑题等方面,o1模型比OpenAI之前的模型更好:“我们发现它可以处理更实质性、更多方面的分析,我们的自动化测试还表明,它在处理一系列简单任务时都有所进步。”

此外,如果点击“展示思路链”便可发现,o1模型在“思考”时似乎格外“拟人化”,加入了“嗯……”、“我很好奇”、“我正在思考”、“好的,让我看看”等口语化的表达来推进思考步骤。

公司高管称,OpenAI 并不认为人工智能模型思维等同于人类思维,这种更具人性化的表达旨在展示模型如何花费了更多时间处理问题并全面、深入地解决问题。

缺点:无法浏览实时网页、无法上传文件和图片、缺乏广泛世界知识、或更易产生幻觉

但作为o1模型的最初始版本,今日发布的o1-预览版也有明显缺点。例如,只是一款“纯文字版”,暂时无法浏览网页信息以及上传文件和图片,也就是说不具备ChatGPT的许多使用功能,在许多常见用例中不如GPT-4o那么强大,而且还有用量限制,o1预览版每周上限为30条消息,迷你版每周上限为50条。

其他被提及的局限性包括:o1模型在很多领域的能力不如GPT-4o,在关于世界的事实知识方面表现不佳;有的用例下推理能力较慢,可能需要更长的时间来回答问题;目前o1只是一个纯文本模型,缺乏针对特定文档进行推理,或者从网络收集实时信息的能力。

此外,让AI模型玩井字棋(Tic-Tac-Toe)一直被认为是个业界难题,拥有推理能力的o1新模型也还是会在这个游戏中出错,即无法完全攻克技术难关。

OpenAI还在一篇技术论文中承认,其收到了一些“轶事反馈”,称o1预览版和迷你版比GPT-4o及其迷你版更容易产生“幻觉”,也就是AI仍在很自信地编造答案,而且o1很少会承认它不知道问题的答案。

知名科技媒体Techcrunch指出,OpenAI在o1模型相关的博文中点明,其决定不向用户展示这一新模型的原始“思维链”,而是选择在答案中给出思维链的总结摘要,目的是为了维持“竞争优势”,为了弥补可能的缺点,“我们努力教导模型在答案中重现思路链中的任何有用想法。”

OpenAI也承认在训练AI模型推理能力方面的竞争压力很大:

“OpenAI可能率先推出了o1。但假设竞争对手很快也会效仿并推出类似的模型,那么公司真正的考验将是让o1得到广泛应用。

OpenAI未来将不断推出o1模型的更新版本,目标是对推理时间长达数小时、数天甚至数周的o1模型进行实验,以进一步提高其推理能力。

除了模型更新之外,我们还希望给o1模型添加浏览网页、文件和图片上传等功能,让它对每个人都更有用。在o1系列之外,我们还计划继续开发和发布GPT系列中的模型。”

在o1正式发布前,曾有媒体称其最早可能在本周向有限数量的用户开放。而且OpenAI并不是唯一致力于开发具有推理能力AI模型的公司,Anthropic和谷歌也都宣称其先进的人工智能模型具有“推理”能力:

“o1模型的发布,正值OpenAI寻求(以1500亿美元的超高估值)筹集数十亿美元资金,并且在开发越来越复杂的人工智能系统方面遭遇更激烈的竞争之际。”

本文来自华尔街见闻,欢迎下载APP查看更多

【新奥彩资料免费提供353期开奖结果】 【澳门4949资料网站】
【2024澳门免费精准资料】 【澳门944c资料免费大全二四六】
【澳门正版资料免费更新结果查询开奖结果查询】 【2024澳门新资料大全免费直播】
【新澳资料最准的网站】 【2024年新澳门开码结果】
【澳门精准资料期期精准】 【香港王中王资料大全免费】
【胡友平见义勇为离世 救人细节披露开奖记录今晚】 【今期香港结果记录开奖记录查询】 【澳门精准免费码资料大全开奖结果记录】
上一条新闻 下一条新闻

推荐文章

发表评论

吴毅将85

3秒前:缺点:无法浏览实时网页、无法上传文件和图片、缺乏广泛世界知识、或更易产生幻觉但作为o1模型的最初始版本,今日发布的o1-预览版也有明显缺点。

IP:53.27.5.*

赵小龙

3秒前:o1模型使用成本至少是GPT-4o的3倍,初始发送信息数有限,采用全新方法训练据介绍,o1新模型通过背后崭新的训练方式,变得可以回答更复杂的编程、数学与科学难题,在给出答案前会先“思考”,而且速度比人类更快。

IP:92.42.9.*

蔡秀彬

2秒前:OpenAI的研究负责人Jerry Tworek对媒体称,o1背后的训练方式与之前的模型有着根本不同。

IP:70.35.3.*

文旅中国APP介绍

APP图标

澳门一码一肖一特一中直播APP名:文旅中国

版本:V4.69.447

更新时间:2024-10-10 24:13

澳门一肖一码100%免费公开这是一个功能强大的2024澳门六开彩结果查询APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:优势:对复杂的推理任务是重大进步,思考越久质量越高,安全性提升,展现思考步骤在优势方面,OpenAI称o1模型对于复杂的推理任务来说是个重大进步,代表了人工智能能力的新水平,而且模型“思考”的时间越长,在推理任务上的表现就越好,因为o1可以花更多时间来考虑一个复杂问题的所有部分,从而有效地进行事实核查。

打开澳门免费资料大全马家婆APP介绍

APP图标

打开澳门网站资料大全APP名:文旅中国

版本:V6.69.122

更新时间:2024-10-10 20:20

无论是四肖八码期期准资料免费长期快速浏览新闻还是深入了解某个话题,这款新闻APP都能为您提供全面、精准的信息服务。

新澳门4949最新记录APP介绍

APP图标

新澳精准资料免费提供APP名:文旅中国

版本:V7.90.553

更新时间:2024-10-10 20:20

澳门资料大全正版免费资料应用界面简洁易用,用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然,让您随时掌握世界动态。此外,您还可以参与评论,与其他读者交流看法,形成一个互动活跃的社区。

澳门赛马会资料最准一码APP介绍

APP图标

新澳门内部资料精准大全82APP名:文旅中国

版本:V6.87.467

更新时间:2024-10-10 24:23

管家一肖一码资料大全这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道,涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能,您可以根据兴趣定制新闻源,确保每条信息都与您相关。

管家婆八肖版资料大全APP介绍

APP图标

新澳高手论坛资料大全最新APP名:文旅中国

版本:V3.57.811

更新时间:2024-10-10 13:14

这是一款功能强大的最准一码一肖100精准应用,专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯,还为您带来今日的最新动态:100万个token即模型解析文字块的规模大小,相当于大约75万个单词。。无论是获取信息还是提升效率,这款APP都是您理想的助手。

2024澳门六今晚结果出来新APP介绍

APP图标

2022澳门免费资料大全下载APP名:文旅中国

版本:V2.85.781

更新时间:2024-10-10 14:16

这是一款功能强大的2024澳门资料免费大全应用,旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯,让您随时了解发生的重大事件。今天的最新内容包括:而且OpenAI并不是唯一致力于开发具有推理能力AI模型的公司,Anthropic和谷歌也都宣称其先进的人工智能模型具有“推理”能力: “o1模型的发布,正值OpenAI寻求(以1500亿美元的超高估值)筹集数十亿美元资金,并且在开发越来越复杂的人工智能系统方面遭遇更激烈的竞争之际。,为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

澳门4949资料免费大全APP介绍

APP图标

新奥门资料大全免费新鼬APP名:文旅中国

版本:V7.81.812

更新时间:2024-10-10 17:17

这是一款功能强大的新奥天天免费资料单双应用,专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯,让您时刻掌握世界动态。今日的最新内容包括:更小、更便宜的迷你版聚焦在编程用例。,为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么,这款APP都能成为您不可或缺的助手。

一码一肖100%中奖资料APP介绍

APP图标

4949cn资料免费大全APP名:文旅中国

版本:V3.49.735

更新时间:2024-10-10 19:13

今天的最新动态包括:此外,让AI模型玩井字棋(Tic-Tac-Toe)一直被认为是个业界难题,拥有推理能力的o1新模型也还是会在这个游戏中出错,即无法完全攻克技术难关。,让您第一时间掌握关键资讯,做出明智的决策。这个应用不仅是您的信息获取工具,更是一个提升生活质量的得力助手。

2024澳门正版资料免费中APP介绍

APP图标

澳门天天开彩好正版挂牌APP名:文旅中国

版本:V2.75.191

更新时间:2024-10-10 16:13

这是一款功能强大的626969澳门资料大全版应用,能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯,以及今天的最新动态:ChatGPT Enterprise和Edu用户下周能使用这两种模式,未来某个未知时刻还将向所有免费用户提供o1-mini的访问权限。。

一码一肖100%APP介绍

APP图标

最准一码一肖100%噢APP名:文旅中国

版本:V7.95.491

更新时间:2024-10-10 21:15

这款功能强大的澳门正版资料应用旨在提升您的日常效率,帮助您轻松应对各种任务。应用界面友好直观,用户可以快速导航,获取所需信息。它不仅提供最新的24小时热点资讯,还定期更新各种主题的文章和评论,确保您始终走在信息的前沿。

2024澳门正版资料全年免费APP介绍

APP图标

澳门最准一肖一码一码匠子生活APP名:文旅中国

版本:V2.33.323

更新时间:2024-10-10 23:23

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源,提供最新的头条、热点和专题报道,涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送,确保获取最相关的信息。

澳门王中王100%的资料羊了个羊APP介绍

APP图标

澳门最准资料免费网站2APP名:文旅中国

版本:V3.94.174

更新时间:2024-10-10 18:18

APP界面友好,支持快速浏览和离线阅读。您还可以通过搜索功能,快速找到特定主题的新闻。互动功能让您可以评论、分享文章,与朋友讨论热点话题。无论您是在通勤、休闲,还是工作间隙,这款APP都能让您轻松掌握最新动态。