【焦点热闻】重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

首页 > 资讯 > > 内容页

【焦点热闻】重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

发表时间：2023-05-16 15:13:06 来源：站长之家

声明:本文来自于微信公众号新智元（ID:AI_era），作者:新智元，授权站长之家转载发布。

【新智元导读】OpenAI再次开源，是科技大厂的「施舍」还是开源社区的「救赎」?

(资料图片)

就在刚刚，根据The Information的最新爆料，OpenAI即将发布一款全新的开源大语言模型。

虽然目前还不清楚，OpenAI是不是打算利用即将开源的模型，来抢占Vicuna或其他开源模型的市场份额。

但几乎可以肯定的是，新模型的能力大概率无法与GPT-4甚至GPT-3.5相竞争。

毕竟，270亿美元的估值也决定了，OpenAI最先进的模型将会被用于商业目的，尽管前两个版本的GPT都是开源的。

对此，OpenAI的发言人没有回应置评请求。

羊驼家族开源大爆发

十天前，谷歌的一份内部文件泄漏。在这篇名为《我们没有护城河，OpenAI也没有》的文章里，作者沉痛控诉了开源对于谷歌和OpenAI的沉重打击。

的确，在这次军备竞赛中，谷歌和OpenAI似乎都不是赢家，因为开源社区正在吃掉属于它们的「利益」。

ChatGPT一出，引爆了全球的LLM革命。然而，OpenAI不Open，很多公司和开发者只能看着干着急。

此时，Meta站出来发布了LLaMA，为全世界开发者谋了一把福利。

本来呢，Meta承诺的是LLaMA会对非商用的研究用例开源，可是谁能想到，仅在发布一周后，LLaMA的权重忽然在4chan上泄漏了，瞬间就引发了数千次下载。

这场「史诗级泄漏」，直接让开源LLM领域变了天。短短几周内，各种ChatGPT平替就以迅雷不及掩耳之势呈爆炸式增长。

Alpaca、Vicuna、Koala、ChatLLaMA 、FreedomGPT、ColossalChat……简直堪称是「羊驼家族」大爆炸。

其实，早在羊驼之前，开源模型就曾破灭过OpenAI的野心。

当时，刚刚发布的Dall-E2凭借着惊艳的文生图效果，在网上引起了不小的轰动。

然而，当OpenAI还在试图兜售API时，一款开源替代突然横空出世——Stable Diffusion。

随着Stable Diffusion的迅速崛起，Dall-E2也很快就被开发者们抛在了脑后。

开源大模型，要颠覆硅谷大厂?

UC Berkeley的计算机教授Ion Stoica正是使用Meta的研究开发Vicuna的学者之一。

为了提高Vicuna的能力，Stoica和同事们正在努力增加模型中的计算数量，这将有助于处理涉及推理的任务，比如写代码。

开发Vicuna的是一个伯克利的团队，每年的预算为数百万美元，其中大约50万美元来自包括微软、谷歌和亚马逊在内的上市公司。

UC Berkeley的计算机教授Ion Stoica表示，现在的免费AI模型，在性能上已经「相当接近」谷歌和OpenAI的专有模型了，毫无疑问，大多数开发者最终都会选择免费模型。

一方面，开源模型可以让开发者使用自己的数据来解决特定的问题。

另一方面，像Vicuna这种模型的训练成本甚至可以低至几百美元，而且还不用向大厂支付昂贵的使用费。

https://lmsys.org/blog/2023-03-30-vicuna/

如果Stoica的看法正确，开源AI必将颠覆谷歌、OpenAI、微软等出售专有模型使用权的大厂的商业计划。

Vicuna的质量和开源AI的寒武纪大爆发，让谷歌工程师Luke Sernau警告同事，谷歌在努力追赶OpenAI时，太过关注专有软件了。

如果免费、高质量的平替没有使用限制，谁会去付费使用带有条条框框的谷歌产品呢?开源AI的发展正在超越我们，谷歌应该在开源社区中建立自己的领导地位，并放弃对我们模型的部分控制。

这份备忘录迅速在整个行业内引起了共鸣——即使Sernau或许高估了开源AI的能力，低估了它们的成本和风险，但大多数从业者都同意，Meta非常有可能从中获益。

比如，Meta在内部会使用AI模型进行内容推荐和广告定位，当开发者改进Meta的模型时，Meta就可以把这些改进纳入自己内部的AI。

Meta CEO小扎对此筹谋已久。

4月，在他与分析师的一次电话会议中，他曾这样谈到公司的策略——

如果行业能够在我们使用的基础工具上达成标准化，那么我们就能从其他人的改进中受益，这样会更好。

谷歌倒是没有完全采用专有的方式来处理AI软件。

早在2020年，谷歌就发布了一个开源语言模型T5，让开发者可以构建能够执行翻译和摘要任务的软件。随后，谷歌又发布了一个更先进的Flan-T5。

但是，根据Stoica和其他从业者的说法，Meta发布的软件能够在谷歌模型的基础上做出显著改进，这让开发者选择Meta模型的可能性大大增加了。

不过，Stoica表示，谷歌在开源软件方面仍有两个优势。

1. 如果谷歌利用其不向外部开放的用户数据，模型在某些专业领域（如内容推荐）的表现可能会更好。

不过，谷歌发言人表示，公司并没有在现有用户数据上训练其基础模型。

2. 搜索公司在管理大规模计算机基础设施方面的专长，意味着它能够以更低的成本来运行模型，包括为云客户提供服务。

与此同时，OpenAI在收集数百万人与ChatGPT互动方式的数据上，已经抢得了先机，这会更有助于OpenAI改进AI软件，更不用提它和微软的合作协议。

开源的繁荣，是大厂的「施舍」?

不过，这种建立在开源基础上的繁荣，是不稳定的。

目前大多数的开源，仍然依赖于资金雄厚的大公司发布的巨型模型。如果OpenAI和Meta决定关闭业务，繁荣的开源社区，可能就会变得萧条。

比如，现在许多开源平替是基于Meta的LLaMA构建的。

而其他模型使用的是名为Pile的大型公共数据集，由开源非营利组织EleutherAI整理。

EleutherAI之所以存在，是因为OpenAI的开放性意味着一群开发者能够逆向了解GPT-3是如何制作的，然后在空闲时间里创建自己的模型。

但一切都可能改变。

OpenAI已经不再Open，Meta也在考虑限制开源，防止初创公司利用开源代码做坏事。

Meta AI的执行董事Joelle Pineau表示，现在向外部人员开放代码是正确，但他并不确定，在未来五年内Meta还会采用相同的策略。

如果这种Close的趋势继续下去，那么不仅开源社区会被抛弃，下一代的AI突破也会重新回到那些最大、最不差钱的AI实验室手中。

显然，AI大模型的制造和使用方式的未来，正处于一个十字路口。

如果OpenAI曾经吝啬，就不会有如今的开源盛况

其他人也在权衡，这种开源的自由竞争带来的回报更大，还是风险更大。

就在Meta AI发布LLaMA的同时，Hugging Face推出了一个门禁机制，下载平台上的模型之前，用户必须申请访问并获得批准，这是为了限制那些有合法理由的人。

「我并不是一个开源的布道者，」Hugging Face的首席伦理科学家Margaret Mitchell说。「我能看到不开源的意义。」

大模型广泛使用的一个弊端，就是可能造成AI色情产品的泛滥。

Mitchell曾在谷歌工作，并创立了AI道德团队，她对于模型被滥用的风险十分了解。因此，她赞成Meta AI以有控制的方式发布模型。

同时，OpenAI也在关闭水龙头。GPT-4发布时，并没有公布架构（包括模型大小）、硬件、训练计算、数据集构建、训练方法等细节，理由是「鉴于像GPT-4这样的大规模模型的竞争格局和安全影响」。

这种限制反应了OpenAI心态上的变化。联合创始人兼首席科学家Ilya Sutskever表示，OpenAI过去的开放性是一个错误。

OpenAI的政策研究员Sandhini Agarwal说:「以前，如果某样东西是开源的，也许一小群修理工会关心。但现在，整个环境已经改变。开源真的可以加速发展，导致竞争。」

时间倒回三年前，如果OpenAI在公布GPT-3的细节时，就秉持着同样的原则，那就不会有EleutherAI的出现，也就不会有蓬勃的开源创新。

今天，EleutherAI在开源生态系统中发挥着举足轻重的作用。Pile被用来训练多个开源项目，包括Stability AI的StableLM。

但随着GPT-4、5、6被锁死，开源社区可能会再次被落在几家大公司后面。

他们会困在上一代模型中，如果想取得进步，只能闭门造车。

参考资料:

https://www.technologyreview.com/2023/05/12/1072950/open-source-ai-google-openai-eleuther-meta/

https://www.theinformation.com/articles/open-source-ai-is-gaining-on-google-and-chatgpt

（举报）

x 广告

【焦点热闻】重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

【焦点热闻】重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

即时：华生科技董秘回复： 公司一直聚焦主业，持续精耕细作，努力提升企业管理水平

全球快报:万达信用卡逾期六天会有什么影响

国家卫健委：2022年87.71%县医院达到二级医院能力

明日天气早知道 报道

全球实时：突发！马斯克涉嫌卷入美富豪性贩卖案

深圳创维新世界科技有限公司获“元力觉醒·新浪VR 2022年度行业颁奖”最佳品牌创新奖-环球关注

专家解读低房价背后隐忧具体是什么情况

统计局：4月份城镇调查失业率下降

环球通讯！国家能源局：4月份全社会用电量同比增长8.3%

当前速看：第三届中国—中东欧博览会新亮点值得期待

win10玩老游戏错误-(win10玩游戏出现致命错误)

里程碑事件！“互换通”上线运行

体例什么意思网络用语（体例什么意思）

被巴萨“道德绑架”！拉波尔塔表态不会提供高薪，还要求梅西回归 观速讯

杭州卓简纺织服装有限公司_关于杭州卓简纺织服装有限公司概略-环球快消息

杜允唐带红羽回家完整版_杜允唐

香港迪士尼2022财年净亏损21亿港元 已连续8年录得亏损

澳大利亚贸易部长：“不希望与中国脱钩”_天天消息

莫名其妙的心情低落_莫名其妙

热点聚焦：福州新增一处文化新地标，就在晋安湖畔！

光山：一场“饺子宴”巧解“死疙瘩”_快看

新动态：改革开放以来江西累计引进外商投资企业2.1万家

callao是哪个国家的港口(Callao是哪个国家) 当前资讯

焦点精选！人和路街道逸园社区开展“扫黄打非”巡查宣传

精选！假面骑士Geats：说说英寿对道长的三次投喂，都是牛肉料理

【天天热闻】湛川河谷“仙品荔”湾区品鉴会在广州举行

华锋股份：与百度阿波罗目前重点在智能滑板底盘方面合作_全球消息

如何冷冻生肉桂卷

“如果怕了，那就不是人民警察！”

麻城审计“五个到位”助力筑牢防汛安全堤|环球播资讯

有用分期最新信息查询（有用分期最新消息）-当前聚焦

迷路老人遇警察：“师傅，谢谢了！”

一两黄金多少钱人民币_一两黄金多少钱

梅河口市一座营镇邮政编码 吉林省梅河口市邮政编码-每日速看

滨州公安机关关于征集涉网黑恶犯罪线索的通告

四川大学华西第二医院岳池县人民医院“区域联盟医院”授牌仪式举行|每日快报

上海博物馆日免费开放名单一览表(普陀区） 环球滚动

世界聚焦：专家热议能源转型路径：“新房没盖好不要拆老房”

苏迪曼杯打响 国羽5比0横扫埃及迎开门红 当前快看

君山银针可以长期储存吗 君山银针放久了可以喝吗

全球观热点：2023年个人的酒店的工作计划 酒店工作计划如何写汇总(四篇)

恩比德：绿军联盟最强 系列赛多数时候我们打得很努力 今天没打好 环球快资讯

作文成长的烦恼300字_作文成长的烦恼

全球今日报丨艾小图春风多几度_艾小图

比比东死了吗 比比东怎么死的 头条

一个绩效考核方案，竟然差点让企业倒闭-热资讯

飘窗鸡肋？不存在的！只要找对改造方法，绝对又实用又好看-世界微头条

互联互通标的范围扩大后MSCI首次季调 或为A股市场带来近百亿元资金净流入_天天滚动

癌症的早期信号

五座纯电SUV市场竞争太激烈，福特开始瞄准七座SUV市场_全球观察

环球即时：三国杀是边锋的还是游卡的_游卡边锋和三国杀有什么关系简介介绍

世界播报:域名注册需要多少钱_域名注册

恶魔城动画第三季剧情_恶魔城动画剧情-热头条

四川新龙：森林防护巡逻途中 偶遇鬣羚“横渡”雅砻江|全球看热讯

每日快播：如何制作炖羊肉?炖羊肉都需要放哪些调料?

中国中亚关系将开启新篇章具体详细内容是什么|天天快资讯

你是我的荣耀电视剧什么时候播出_你是我的荣耀电视剧什么时候上映_天天精选

重拳！深交所对奥联电子及相关当事人给予公开谴责处分_天天百事通

视焦点讯！建德市人民政府重大行政事项实施开放式决策程序规定

假试用、真使用……毕业生求职这些问题须警惕-滚动

状态也在逐渐回暖！侧翼大将会成为湖人在西决中的奇兵吗？_全球快看

支票丢失的处理办法_支票丢失如何处理 世界最资讯

用占上风造句造句_占上风造句

国际识局：美国多地进入紧急状态 移民或成党争牺牲品

世界今日报丨男子跨省流窜砸车盗窃，通城公安快速破案追赃

世界视讯！怀孕能吃鸡肉吗?

世界消息！电子货架标签概念股_电子货架标签系统

售价24.58-34.58万元 全新林肯冒险家正式上市|全球快报

酷比魔方 iPlay 50 mini 平板下周推出：8.4 英寸屏，首发499 元 独家焦点

银行理财拐点已来，单月回升近1.2万亿

第11届中国国际警用装备博览会 前沿警用装备纷纷亮相

“所谓”是什么意思(所谓是什么意思)|滚动

表白的话感人的一段话100字以内 表白的话感人的一段话

全球新消息丨岭南 + 非遗 + 古迹灵感碰撞，海峡两岸青年设计师走秀展佳作

小儿豉翘清热颗粒 小儿_全球热资讯

世界焦点！知情人谈婆婆将儿媳压身下数落 或因带孩子引发矛盾

全球微动态丨青海省计划增殖放流水生生物2075万尾

2023亚洲杯决赛阶段比赛分组抽签已经揭晓

即时：华生科技董秘回复：公司一直聚焦主业，持续精耕细作，努力提升企业管理水平

明日天气早知道报道

被巴萨“道德绑架”！拉波尔塔表态不会提供高薪，还要求梅西回归观速讯

香港迪士尼2022财年净亏损21亿港元已连续8年录得亏损

梅河口市一座营镇邮政编码吉林省梅河口市邮政编码-每日速看

上海博物馆日免费开放名单一览表(普陀区）环球滚动

苏迪曼杯打响国羽5比0横扫埃及迎开门红当前快看

君山银针可以长期储存吗君山银针放久了可以喝吗

全球观热点：2023年个人的酒店的工作计划酒店工作计划如何写汇总(四篇)

恩比德：绿军联盟最强系列赛多数时候我们打得很努力今天没打好环球快资讯

比比东死了吗比比东怎么死的头条

互联互通标的范围扩大后MSCI首次季调或为A股市场带来近百亿元资金净流入_天天滚动

四川新龙：森林防护巡逻途中偶遇鬣羚“横渡”雅砻江|全球看热讯

支票丢失的处理办法_支票丢失如何处理世界最资讯

国际识局：美国多地进入紧急状态移民或成党争牺牲品

售价24.58-34.58万元全新林肯冒险家正式上市|全球快报

酷比魔方 iPlay 50 mini 平板下周推出：8.4 英寸屏，首发499 元独家焦点

第11届中国国际警用装备博览会前沿警用装备纷纷亮相

表白的话感人的一段话100字以内表白的话感人的一段话

小儿豉翘清热颗粒小儿_全球热资讯

世界焦点！知情人谈婆婆将儿媳压身下数落或因带孩子引发矛盾

太阳变阵倒数：艾顿或有9队哄抢湖人领跑保罗下家 BD建队再冲冠观速讯

未来已来！10个场景看雄安之变最新资讯

[路演]积成电子：未来将持续推动电磁暂态仿真系统在行业内的应用为建设新型电力系统贡献力量_每日播报

【全球聚看点】文件明明没有打开却不能删除无法删除文件夹被另一个程序使用

天齐30亿元、赣锋25亿元两大锂业巨头同日加码锂电产业上下游_动态

新三板挂牌专精特新企业4月末融资合近15亿单笔最高超2亿|今日热门

道县：持续提升城市品质让城市更美好人民更幸福

葛粉_关于葛粉的简介当前通讯

维金斯：如果你的防守好你就有很好的机会来赢下并掌控比赛

基因强大！钟嘉欣大晒三代同堂全家福！原来美貌遗传妈妈看点

环球观热点：泰晤士报：哈兰德凭自定义评分系统选择曼城本泽马成皇马扣分原因

批发零售业行业：从渠道走向品牌估值体系重塑

佳力图: 603912：佳力图关于公司及子公司使用部分闲置可转换公司债券募集资金进行现金管理的进展公告世界简讯

梦三巴萨彻底走光！当年的这支宇宙队，是否为本世纪最佳球队要闻

天天新动态：重庆铜梁：特色种植助农增收金丝皇菊带来“美丽经济”

李云泽任国家金融监督管理总局党委书记环球简讯

天天快讯:SMM镁锭现货快报：市场混乱运行高位成交跟进有限

环球速看：刘震云编剧电影立项《一句顶一万句之老詹》曝光

杭州：西湖景区莲花绽放恍若走进“莫奈花园”|全球热点