杂谈车界2024年10月11日发布:重磅!OpenAI打开大模型思考黑盒,用AI解释AI的时代来了

⭐发布日期:2024年10月11日 | 来源:杂谈车界

⭐作者:弗兰西斯·麦克多蒙德 责任编辑:Admin

⭐阅读量:109 评论:5人

【澳门免费资料大全精准版开奖结果今晚】

【494949结果最快】

【2024澳门管家婆资料正版大全】 【2024澳门码今晚结果】 【2024澳门正版资料最新开奖记录】 【澳门免费公开资料大全】 【溪门精淮一肖一吗100】 【六开彩澳门网站】 【二四六天天免费资料门图讯最快开开奖记录查询】 【马会传真资料大全开奖结果记录】
【新奥门资料大全免费新鼬开奖结果查询】 【澳门正版资料大全免费更新】 【2024年新澳门彩结果查询】 【7777788888澳门】 【澳门资料免费大全】 【澳门传真资料查询】 【澳门一码一码100准确开奖历史记录】 【澳门一肖一码100%免费公开开奖结果记录】

智东西(公众号:zhidxcom

作者 | 程茜

编辑 | 云鹏

智东西5月10日报道,今天,OpenAI官方博客发布新的研究进展,研究人员正在使用GPT-4来自动解释GPT-2的行为。

当下大型语言模型正在扎堆发布,但对于它背后的思考过程我们知之甚少。而今天,OpenAI正在打开大型语言模型的思考“黑盒”,让AI被自己解释!

这一技术的具体实现方式是,研究人员先给定GPT-2一个主题,并让其生成文本序列,再用GPT-4解释GPT-2生成的内容,再通过GPT-4模拟GPT-2的下一步操作,最后将GPT-4模拟生成的和GPT-2实际生成的内容进行对比评分。

目前,OpenAI已经通过GPT-4对GPT-2中307200个神经元进行了书面解释,从结果来看,绝大多数的解释评分并不高,超过1000个神经元的解释得分高于0.8,不过研发人员称,这一结果意味着基于GPT-4,他们已经解释了神经元的大部分激活行为。

虽然目前从结果来看,OpenAI通过GPT-4解释GPT-2的效果并不完美,但这一阶段性的成果给AI可解释性研究提供了思路,这一方法会随着AI的发展而不断精进。

此外,OpenAI正在开源其307200个神经元的书面解释的数据集和可视化工具,以及使用OpenAI API上公开可用的模型进行解释和评分的代码。

论文地址:

https://openaipublic.blob.core.windows.net/neuron-explainer/paper/index.html

神经元查看器:

https://openaipublic.blob.core.windows.net/neuron-explainer/neuron-viewer/index.html

GitHub开源地址:

https://github.com/openai/automated-interpretability

一、解释、模拟、评分,三步看透GPT-2的思考过程

OpenAI解释神经元的过程使用了三种算法,分别是能显示神经元对文本摘录响应的解释器模型Explain、使用模拟器模型Simulate根据生成文本解释模拟神经元激活、Score算法对模拟激活内容与真实激活内容的匹配程度进行评分。

在测试过程中,研究人员使用GPT-2预训练模型作为被解释的模型,使用GPT-4作为解释器和模拟器模型。

研究人员选择不同的文档来生成解释和模拟,这一方法包括在每个神经元上运行下面3个步骤:

首先,先给定GPT-2一个主题去生成文本,然后使用GPT-4来生成对GPT-2生成文本序列的行为解释。

如,当GPT-2生成“漫威漫画(Marvel comics vibes)”相关内容时,GPT-4生成的解释是其文本中有“对电影、角色和娱乐的引用”。给定主题是“明喻(similes)”时,GPT-4生成的解释是“比较和类比,常用‘like(类似)’这个词”。

测试案例:上图主题是“漫威漫画(Marvel comics vibes)”、下图主题是“明喻(similes)

第二步,使用GPT-4模拟神经元的行为。这一步骤想要回答的问题是,假设GPT-4的解释准确而全面地解释了神经元的行为,那么该神经元将如何针对特定序列中的每个标记激活。

刚开始,研究人员使用了“一次一个(one at a time)”方法,提供给GPT-4的提示由一些小样本和预测单个神经元激活的单样本示例组成,但这种方法速度较慢。随后,研究人员使用少量示例并行化了所有标记的概率预测,使得激活值变为文本序列中随机位置的实际值,他们将这种方法称为“一次全部(all at once)”。

经验证,这种研究方法在预测人类偏好方面,与速度较慢的“一次一个”方法效果类似。

第三步,将GPT-4模拟的内容与GPT-2真实生成的内容进行对比,根据其匹配程度进行评分。

研究人员采用的主要评分方法是相关性评分,如果模拟神经元的行为与真实神经元相同,则得分为1。如果模拟神经元的行为是随机的,当解释与神经元行为无关得分将趋向于0。

不过,基于模拟的评分实际上并不能反映人类对解释的准确评估。因此他们收集了人类对GPT-4生成解释质量的评估,并与模拟生成的评分结果相比较。

结果表明,人类往往更喜欢得分较高的解释而不是得分较低的解释,随着得分差距的扩大,这种现象的发展趋势也会更加明显。

二、开源数据集,业界加速AI可解释性研究

从整体评分结果来看,OpenAI测验生成的绝大部分解释得分都较低。不过同时,研究人员也发现了一些GPT-4不理解的有趣神经元。

如“dollars”的意思,第一层理解为“与货币和金钱有关的词”;第二层为“‘buck(美元)’一词或包含‘buck(美元)’的实例”;第29层为“提及‘美国’及相关术语”。

因此,研究人员希望随着解释的改进,能够快速理解这些大型语言模型生成的有趣内容。研发人员认为,他们可以使用机器学习技术来进一步提高GPT-4解释的能力。

以下几种方法可以帮助提高评分结果:

1、迭代解释(Iterating on explanations)。研发人员通过要求GPT-4提出可能的相反案例,然后根据它们的激活结果修改解释来提高分数。

2、使用更大的语言模型来给出解释(Using larger models to give explanations)。随着解释器模型能力的提高,平均分数也会上升。然而,即使是GPT-4这样参数规模的大型语言模型也给出了比人类更差的解释,这表明还有改进的余地。

3、更改已解释模型的架构(Changing the architecture of the explained model)。具有不同激活函数的训练模型提高了解释分数。

因此基于上述考虑,OpenAI开源了数据集,他们希望研究界能够开发新技术来生成更高分的解释,并开发更好的工具来解释GPT-2。

三、用GPT-4解释GPT-2仍有四大局限

目前,OpenAI用于解释的GPT-2的方法还有很多局限性:

研究人员希望GPT-4生成的解释是简短的自然语言,但神经元可能具有非常复杂的行为,无法被简洁清晰的叙述出来。例如,神经元可以代表许多不同的概念,或者可以代表人类不理解或无法用语言表达的单一概念。

他们希望最终自动找到并解释实现复杂行为的整个神经回路,使得神经元和注意力中枢协同工作。OpenAI当前的方法仅将神经元行为解释为原始文本输入的函数,而没有说明其接下来产生的影响。例如,当神经元激活的位置是一个句号,这可以指向后面的英文单词应该大写开头等。

这一评分系统解释了神经元的行为,但没有试图解释产生这种行为的机制。由于这一方法更多描述的是测试文本上的相关性,因此模拟过程中获得高分的解释,对于测试外的文本解释效果可能也很差。

最后,用GPT-4来解释GPT-2的整个过程是计算密集型。

不过,OpenAI的研究人员仍对这一方法的推广感到兴奋。最终,他们希望使用大型语言模型来生成、测试和迭代完全通用的预测。

结语:让大模型的黑盒变透明

大型语言模型在内容生成、理解上的强大能力我们已经有目共睹,但其内部的工作原理我们知之甚少,也很难从大型语言模型的最后输出结果中检测到它们的“思考过程”是有偏见的或者是错误的。

尽管从结果看,OpenAI的研究方法还有很大的进步空间,但这一技术路线也为AI的可解释性研究提供了思路。

【2024新澳彩料免费资料开奖结果】 【新澳资料最准的网站】
【澳门最准四不像】 【管家婆八肖版资料大全】
【澳门最精准最快的资料开奖结果查询】 【2021澳门天天开彩】
【跑狗图正版高清新一代论坛】 【澳门正版资料免费更新结果】
【澳门一码中精准一码免费中特论坛】 【澳门天天开彩期期精准】
【新澳门号码2024年结果开奖记录今晚】 【949494王中王内部精选开奖记录查询】 【澳门今晚开特马四不像图开奖结果记录】
上一条新闻 下一条新闻

推荐文章

发表评论

Asatiani

2秒前:这一评分系统解释了神经元的行为,但没有试图解释产生这种行为的机制。

IP:94.57.4.*

Verónica

2秒前:com/openai/automated-interpretability一、解释、模拟、评分,三步看透GPT-2的思考过程OpenAI解释神经元的过程使用了三种算法,分别是能显示神经元对文本摘录响应的解释器模型Explain、使用模拟器模型Simulate根据生成文本解释模拟神经元激活、Score算法对模拟激活内容与真实激活内容的匹配程度进行评分。

IP:91.86.4.*

安田のぞみ

6秒前:不过,基于模拟的评分实际上并不能反映人类对解释的准确评估。

IP:61.47.5.*

杂谈车界APP介绍

APP图标

2024噢门天天开好彩大全APP名:杂谈车界

版本:V7.99.564

更新时间:2024-10-10 19:13

新澳门内部资料精准大全有购买吗这是一个功能强大的澳门正版资料大全资料生肖卡APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:在测试过程中,研究人员使用GPT-2预训练模型作为被解释的模型,使用GPT-4作为解释器和模拟器模型。

澳门免费资料大全精准版853APP介绍

APP图标

2024新澳门原料免费462APP名:杂谈车界

版本:V5.58.466

更新时间:2024-10-10 14:18

无论是新澳门正版资料快速浏览新闻还是深入了解某个话题,这款新闻APP都能为您提供全面、精准的信息服务。

2024澳门六开彩结果查询APP介绍

APP图标

新澳门资料大全免费安装APP名:杂谈车界

版本:V2.83.687

更新时间:2024-10-10 16:17

澳门王中王100%的资料155期应用界面简洁易用,用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然,让您随时掌握世界动态。此外,您还可以参与评论,与其他读者交流看法,形成一个互动活跃的社区。

新澳精准资料免费提供网站有哪些APP介绍

APP图标

澳门管家婆免费资料查询APP名:杂谈车界

版本:V8.46.286

更新时间:2024-10-10 14:19

澳门正版资料大全这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道,涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能,您可以根据兴趣定制新闻源,确保每条信息都与您相关。

今晚最准一码100准APP介绍

APP图标

2024今晚澳门开特马APP名:杂谈车界

版本:V8.53.854

更新时间:2024-10-10 24:15

这是一款功能强大的新澳门资料大全免费新鼬077应用,专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯,还为您带来今日的最新动态:如果模拟神经元的行为是随机的,当解释与神经元行为无关得分将趋向于0。。无论是获取信息还是提升效率,这款APP都是您理想的助手。

2024澳门六今晚结果出来新APP介绍

APP图标

2024澳门今天晚上开什么生肖APP名:杂谈车界

版本:V9.27.677

更新时间:2024-10-10 20:22

这是一款功能强大的澳门最精准免费资料大全98期应用,旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯,让您随时了解发生的重大事件。今天的最新内容包括:windows.,为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

一码一肖100APP介绍

APP图标

新澳好彩免费资料查询2024APP名:杂谈车界

版本:V9.55.561

更新时间:2024-10-10 18:16

这是一款功能强大的澳门精准免费码资料大全应用,专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯,让您时刻掌握世界动态。今日的最新内容包括:由于这一方法更多描述的是测试文本上的相关性,因此模拟过程中获得高分的解释,对于测试外的文本解释效果可能也很差。,为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么,这款APP都能成为您不可或缺的助手。

澳门王中王100%的资料APP介绍

APP图标

2024澳门资料大全正新版APP名:杂谈车界

版本:V7.64.346

更新时间:2024-10-10 13:23

今天的最新动态包括:blob.,让您第一时间掌握关键资讯,做出明智的决策。这个应用不仅是您的信息获取工具,更是一个提升生活质量的得力助手。

2024澳门天天开好彩大全记录APP介绍

APP图标

澳门最准的资料免费公开APP名:杂谈车界

版本:V4.90.514

更新时间:2024-10-10 17:16

这是一款功能强大的2024今晚香港开特马开什么应用,能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯,以及今天的最新动态:不过,OpenAI的研究人员仍对这一方法的推广感到兴奋。。

吃什么降压得快效果好APP介绍

APP图标

澳ⅰ门天天好彩APP名:杂谈车界

版本:V6.95.487

更新时间:2024-10-10 23:16

这款功能强大的澳门王中王只开结果应用旨在提升您的日常效率,帮助您轻松应对各种任务。应用界面友好直观,用户可以快速导航,获取所需信息。它不仅提供最新的24小时热点资讯,还定期更新各种主题的文章和评论,确保您始终走在信息的前沿。

二四六香港资料期期准2024APP介绍

APP图标

香港资料大全正版资料2024年免费APP名:杂谈车界

版本:V7.17.611

更新时间:2024-10-10 14:13

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源,提供最新的头条、热点和专题报道,涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送,确保获取最相关的信息。

澳门正版免费全年资料大全问你APP介绍

APP图标

2024年澳门版资料APP名:杂谈车界

版本:V9.13.844

更新时间:2024-10-10 24:23

APP界面友好,支持快速浏览和离线阅读。您还可以通过搜索功能,快速找到特定主题的新闻。互动功能让您可以评论、分享文章,与朋友讨论热点话题。无论您是在通勤、休闲,还是工作间隙,这款APP都能让您轻松掌握最新动态。