美国斯坦福抄袭中国大模型事件背后,让国人重新评估中美 AI 差距与价值|钛媒体AGI

⭐发布日期:2024年09月21日 | 来源:搜狗资讯

⭐作者:陈朴 责任编辑:Admin

⭐阅读量:342 评论:8人

【2024澳门资料大全正版资料免费】

【新奥六开彩结果查询合肥】

【澳门正版资料大全网站】 【四六好彩7777788888】 【澳门传真免费费资料】 【123969澳门资料大全】 【2024年新澳门天天】 【澳门二四六天天资料大全2024】 【澳门马会7777788888】 【新澳门六号码记录】
【新澳门正版资料】 【澳门资料大全正版资料2024年公开】 【澳门一码一肖100%】 【新奥门免费资料大全历史记录开马】 【澳门王中王100】 【澳门三肖三码期期准精选1是】 【新奥彩资料免费提供353期】 【澳门六开彩资料查询最新2024年网站】

(图片来源:钛媒体App编辑拍摄)

美国斯坦福AI团队抄袭清华系大模型事件持续发酵,引起舆论哗然。

钛媒体6月4日消息,针对斯坦福大学AI团队主导的 Llama3-V 开源模型被证实套壳抄袭国内开源模型MiniCPM-Llama3-V 2.5一事,斯坦福Llama3-V团队作者之一的Aksh Garg(阿克沙·加格)最新表示致歉。

4日凌晨,Aksh Garg发推文称,“首先,我们要向MiniCPM原作者道歉。我、Siddharth Sharma,以及Mustafa(穆斯塔法)一起发布了Llama3-V,Mustafa为这个项目编写了代码,但从昨天起就无法联系他。我与Siddharth Sharma主要负责帮助Mustafa进行模型推广。我们俩查看了最新的论文,以验证这项工作的新颖性,但并未被告知或意识到OpenBMB(清华团队支持发起的模型库)之前的任何工作。我们向作者道歉,并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。”

而另一位作者Siddharth Sharma(森德哈斯·沙玛)也表示致歉,并称将Llama3-V模型悉数撤下。另外,美国斯坦福人工智能实验室主任Christopher David Manning也发文谴责这一抄袭行为,并赞扬MiniCPM中国开源模型工作。

这一消息近期持续引发关注和热议,并于4日上午登上微博热搜第二位、第四位。

事件起源于5月29日,一个斯坦福AI 团队在网络上宣传只需500美元就可训练出一个超越GPT-4V的SOTA多模态大模型。随后网友发现,该团队的Llama3-V模型使用的模型结构和代码与面壁智能不久前发布的MiniCPM-Llama3-V2.5极为相似,仅修改了部分变量名。Llama3-V也具有与MiniCPM-Llama3-V 2.5相同的分词器,包括后者新定义的特殊符号。

此前,Garg在介绍Llama3-V的文章中提到,Llama3-V是首个基于Llama-3构建的多模态大模型,训练费用不到500美元。并且与多模态大模型Llava相比,Llama3-V性能提升了10-20%。同时,Llama3-V的性能表现与其参数大小100倍的闭源模型非常相近。

然而,万万没想到,这个大模型最后被网友曝光出抄袭了面壁智能和清华联合研发的MiniCPM-Llama3-V 2.5大模型产品。

6月2日深夜,面壁智能团队证实,斯坦福大模型项目Llama3-V与MiniCPM一样,可以识别出“清华简”战国古文字,“不仅对得一模一样、连错得都一模一样”。这一古文字数据为研究团队花费数月从清华简上逐字扫描并人工标注得来,并未对外公开,证实抄袭事实。

面壁智能联合创始人、CEO李大海发朋友圈表示,“我们对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”

面壁智能联合创始人、首席科学家、清华大学长聘副教授刘知远表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。面壁开源的 MiniCPM-Llama3-V 2.5 就用了最新的Llama3 作为语言模型基座。而开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。他们在受到质疑后已在Huggingface删库,该团队三人中的两位也只是斯坦福大学本科生,未来还有很长的路,如果知错能改,善莫大焉。

据悉,北京面壁智能科技有限责任公司成立于2022年8月,今年4月,面壁智能完成新一轮数亿元融资,由哈勃领投,春华创投、北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。同时,面壁智能发布MiniCPM 2系列开源端侧模型。李大海表示,推动大模型在端侧的落地是面壁目前的重点工作之一。

因此,这件事让大模型“套壳”的回旋镖,结结实实地“扎”到了美国科研团队身上,同时也促使国内重新评估中国 AI 的差距和价值。很显然,差距并没有那么大、开源大模型并没有落后,甚至国外“套壳”中国大模型,说明国内大模型技术处于全球领先水平。

但同时,人们也要清醒看到,目前全球对于大模型“套壳”没有明确的界定,中国80%以上的大模型数据训练来源都包含Meta Llama系列模型,以及国内外互联网平台数据,国内存在很多非Meta授权的模型。因此,这其中的知识产权和法律界定模糊不清,所谓“抄袭”上升不到法律问题。

据Meta Llama官网显示,国内除了海天瑞声之外,至今没有任何中国公司获得Meta Llama的国际合作伙伴(global partners)授权,基本上都是从Hugging Face、官网填写表格或者是其他非官方平台下载的模型数据,更不用谈这些企业是否拿到Meta官方的商业化授权了。

Meta Llama 2开源模型协议中曾指出,“该模型可以用于商业用途,除非你的产品的月活跃用户数超过7亿。需要填写一个表格才能获得访问权限,这个表格也会让你从HuggingFace的网站上下载模型。”

开源大模型以及开源社区的构建本意,是促进技术的共享和交流,加速AI的发展,大众应该重新认知到开源大模型的技术优势。

一位行业专家曾对钛媒体App表示,使用开源项目,主要有两点,一是要声明原作者是谁,你用的是哪个项目,而且要遵循开源项目里的开源协议、作者声明,不能修改且不能删除;二是关注项目对商业化的友好程度,有些是表明可用于商业项目,还有一种不允许商业化、二次开发等因素的开源项目,这部分需要开发者重新去沟通与评估。

未知资本常务董事william wong曾表示,“现在很多初创公司,后台接入ChatGPT,前端做了个UI设计,就上架苹果商店鼓吹自己在做AIGC创业了。”而他认为,这种AIGC项目没有技术壁垒和商业逻辑,只是“蹭热度”。

截至发稿前,美国斯坦福大学官方层面对此并未做出更进一步回应。

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)

【2024澳门天天开好彩大全免费】 【新澳天天开奖资料大全最新】
【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】
【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】
【2024全年资料免费大全】 【新澳天天开奖资料大全】
【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】
【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】 【澳门最准四不像】
上一条新闻 下一条新闻

推荐文章

发表评论

余梦寒

4秒前:开源大模型以及开源社区的构建本意,是促进技术的共享和交流,加速AI的发展,大众应该重新认知到开源大模型的技术优势。

IP:52.20.7.*

王嘉明

8秒前:面壁开源的 MiniCPM-Llama3-V 2.

IP:40.86.8.*

牛晓博

6秒前:因此,这件事让大模型“套壳”的回旋镖,结结实实地“扎”到了美国科研团队身上,同时也促使国内重新评估中国 AI 的差距和价值。

IP:36.98.9.*

搜狗资讯APP介绍

APP图标

2024澳门今天晚上开什么生肖APP名:搜狗资讯

版本:V5.52.156

更新时间:2024-09-20 18:16

2024年正版资料免费大全这是一个功能强大的2024年新澳结果APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:

新澳门码精准资料APP介绍

APP图标

澳门传真资料查询APP名:搜狗资讯

版本:V1.76.895

更新时间:2024-09-20 19:15

2024新奥免费资料这是一个功能强大的2024新澳门天天开好彩大全APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:并且与多模态大模型Llava相比,Llama3-V性能提升了10-20%。

2024新澳免费资料大乐季APP介绍

APP图标

新澳门四肖八码凤凰码APP名:搜狗资讯

版本:V4.47.723

更新时间:2024-09-20 23:16

新奥天天免费资料这是一个功能强大的4949澳门现场+直播APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:需要填写一个表格才能获得访问权限,这个表格也会让你从HuggingFace的网站上下载模型。

新澳2024今晚资料APP介绍

APP图标

新澳门六开彩今晚现场视频APP名:搜狗资讯

版本:V4.69.260

更新时间:2024-09-20 23:24

494949结果最快这是一个功能强大的澳门内部正版免费资料软件优势APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:”

777777788888888最快APP介绍

APP图标

2024澳门历史记录APP名:搜狗资讯

版本:V3.80.252

更新时间:2024-09-20 20:23

澳门一肖一码期期结果准这是一个功能强大的2024澳门资料大全正版APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:我们希望团队的好工作被更多人关注与认可,但不是以这种方式。

澳门免费资料最新跑狗图APP介绍

APP图标

一码一肖100准确使用方法APP名:搜狗资讯

版本:V4.26.972

更新时间:2024-09-20 16:15

管家婆八肖版资料大全这是一个功能强大的澳门开彩结果历史APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:同时,Llama3-V的性能表现与其参数大小100倍的闭源模型非常相近。

澳门内部资料和公开资料APP介绍

APP图标

2024年澳门天天开好彩大全APP名:搜狗资讯

版本:V6.52.659

更新时间:2024-09-20 24:15

新澳好彩免费资料查询2024这是一个功能强大的澳门一码一肖100%精准APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:此前,Garg在介绍Llama3-V的文章中提到,Llama3-V是首个基于Llama-3构建的多模态大模型,训练费用不到500美元。

澳门一码中精准一码免费中特论坛APP介绍

APP图标

澳门神算子六肖6码免费公开APP名:搜狗资讯

版本:V9.28.879

更新时间:2024-09-20 19:16

澳门精准正版资料免费看这是一个功能强大的2024新澳免费资料大全APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:面壁智能联合创始人、首席科学家、清华大学长聘副教授刘知远表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。