开源VS闭源,Meta“格局打开”的同时打开了大模型竞赛新路
1998年,Christine Peterson首次提出“开源软件”(Open Source Software)概念,自此,开源在全球蓬勃发展。二十多年过去,曾经口口声声喊着“开源软件是毒瘤”的微软成为了“开源”的拥趸,Red Hat、SUSE等企业大力开发“开源”的乐土也由此获得巨大的成功。
【资料图】
直至今日,我们看到开源技术愈发成熟,开源理念深入人心,越来越多的人投身于开源生态的建设当中。与此同时,关于“开源”与“闭源”之争在各个领域也都轮番上演,永不停歇。
当下,在全球的大模型竞赛中,也迎来了开、闭源的一次“交锋”。
上个星期,在微软的Inspire 合作伙伴大会上,Meta宣布和微软深化合作,正式推出新一代开源大型语言模型Llama 2,并宣称这一模型将免费开放给商业和研究使用。
Meta创始人扎克伯格在Facebook上发帖表示:“Meta有着悠久的开源历史,开源推动创新,它让更多开发人员能够使用新技术进行开发,同时提高了技术的安全性。我们相信如果生态系统更加开放,将会带来更多进步,这就是我们开源 Llama 2 的原因。”
显而易见,Meta正在致力于打破OpenAI和谷歌正在构建的技术高墙,力图通过生态的开放打造一个真正“open”的AI产业。由此,大模型的竞逐,也再次迎来了新的发展局面。
01
Llama 2:能力超越 GPT-3,不及
什么是 Llama 2?
Llama 2是Meta今年3月初发布的 Llama 大模型的“升级”版本,相较于Llama 1,新版Llama 2 在模型规模、训练数据量、数据质量、训练技术、模型结构、安全训练等多个方面进行了全面提升。
(Llama 2与Llama 1对比)
首先在模型规模上,据扎克伯格介绍,Llama 2的参数分别为70亿,130亿和700亿三个版本。Llama 2 预训练模型接受了2万亿个 tokens 的训练,上下文长度是 Llama 1 的两倍,其微调模型已经接受了超过 100 万个人类注释的训练。此外,其还将单条文本的最大长度从2048个token 提升至4096 个token,更长的文本输入这也就意味着可以包含更多上下文信息,从而提升模型的理解能力。
在训练数据量上,官方数据显示,Llama 2比Llama 1预训练的数据多40%,并对其架构进行了改进。据悉,Llama 2 采用了分组查询注意力机制(grouped-query attention),可以显著降低计算和内存需求,提高大型模型推理的可扩展性及速度。
在安全性和质量方面,Meta研究人员在一篇概述Llama 2的论文中表示:“我们已经采取措施提高这些模型的安全性,使用特定于安全性的数据注释和调整,以及进行使用迭代评估。”据介绍,Llama 2应用了有监督的微调和RLHF。
Meta声称,Llama 2 在许多外部基准测试中都优于Llama 1和其他开源大语言模型,包括推理、编码、熟练程度和知识测试。
来自伯克利大学的人工智能专业博士Nathan Lambert在自己的博客中对Meta发表的Llama 2的论文发表了自己的看法。他表示,Llama 2模型评估结果令人兴奋不已,在经过基准测试后,Llama 2已经超越 GPT-3,在推理任务上,Llama 2 接近,确定是第一个能达到ChatGPT水平的开源模型。
Nvidia高级AI科学家Jim Fan估测Llama-2的训练费用可能超过 2000 万美元,他表示,在“HumanEval”(标准编码基准)上,Llama-2 还与存在显著差距,它还不如 StarCoder 或其他许多专门为编码而设计的模型。
尽管在能力方面,Llama-2还不及,但它的意义不止于此,最令业内激动的地方,在于它免费开放给商业和研究使用。
当下, Meta已开源了Llama 2预训练模型的代码和参数,并开放了商业使用许可。值得注意的是,月活量超过7亿的产品需要另外申请商用许可。
作为Llama 2的首选合作伙伴微软,Meta 表示,Llama 2 可在 Azure AI 模型目录中使用,当然,也可通过Amazon Web Services(AWS)、Hugging Face和其他提供商获取使用。
02
格局打开?大模型竞逐新局面到来
对于此次Meta将免费将 Llama 2开放给商业和研究使用,不少人评论道:“格局打开了”,相较于走闭源路线的OpenAI,Meta真正做到了“Open”。
对于愈发激烈的大模型竞赛而言,这又意味着什么?
用图灵奖得主、Meta 首席人工智能科学家 Yann LeCun的话来说,Meta此举或将改变大模型行业的竞争格局。
如果说 OpenAI发起了大模型的竞赛开始,那么,Meta则打开了大模型竞逐的新局面,开源大模型的新路由此开辟。
开源的意义在哪里?小米副总裁崔宝秋曾指出,开源的本质是协同和创新,协同是全世界所有人各方开源力量的协同,创新是一个技术的创新。
简单来说,开源大模型将能汇聚更多的技术创新力量,在这里,全球开发者、研究机构、科技企业将一同协同共建,大家一块让模型的数据更加丰富、模型更加优化、工具更加完善、应用更加全面...可以说是“众人拾柴火焰高”,从而加速大模型技术的迭代升级、应用的丰富发展,为大模型的发展方向打开更多的可能性,同时也惠及更多的人群。
此外,开源也就意味着个人开发者和中小型企业能够以最低的成本调用Llama 2大模型,而不是花费高昂的成本采购闭源大模型,这也有利于开源大模型用户的吸纳与培养以及大模型开源生态的构建。
据悉,当下开源社区Hugging Face已成为“顶流中的顶流”,其上面有超 25 万个模型,包括 Meta 的Llama 2、国内搜狐创始人王小川创立的百川智能的大语言模型“百川”。
可以说,开源是吸纳、培养用户、确定行业标准的重要途经,也是避免当下AI大模型企业一轮又一轮重复造轮子、低成本试错的理想商业化手段。
03
开源vs 闭源:两者并非选择题
开源大模型出现后,随之而来的便是一道选择题:模型的底座选择到底是开源还是闭源?
尽管开源“免费的饭很香”,但也并非不存在问题,或者说,在很多层面,闭源大模型仍保持着领先优势。
一方面,在模型质量上,闭源大模型的质量更高,比如说最前沿的GPT-4便是闭源大模型,正如前文所言,哪怕是当下可以说是最强势的Llama-2 还与存在显著差距。
数据显示,在学术界广为引用的、由斯坦福大学计算机系研究团队发表的《Holistic Evaluation of Language Models》论文中,对国外30个主流语言模型在准确率、鲁棒性、公平性、推理等主要指标进行评测,便发现:开源(Open)模型在大多数指标上表现弱于闭源(Close)或部分开源(Limited)的模型。
另一方面,大模型最终指向的还是产业落地,在商业化落地上,闭源大模型的能力更强。大模型要想落地就必须与企业业务相结合,这需要专业的人提供专业的服务能力,让大模型的能力与业务场景完美融合,并非一朝一夕的事情,需要长期赋能,这不是免费的开源大模型能做到的事情。
此外,大多数的开源大模型是“站在巨人肩膀上”推出的,也就是说处于领先水平的开源模型都是由大企业开发,话语权也都掌握在他们手中,繁荣的背后也存在着一丝不确定性。
换言之,着眼当下,闭源大模型是大模型落地商业化更优的选择,但这不代表,只能选择闭源大模型,放眼未来,开源大模型是让AI普惠化实现的重要方向。
俗话说,小孩子才做选择,大人的世界是全都要,开源与闭源并非选择题,也正如百川智能创始人王小川所言:“今天不能简单的说我们未来大模型就是走向OpenAI——闭源的中心化的模型。开源实际上是具备着很大的可能性,有可能蕴含着极大商业模式和价值。”
总言之,在大模型这场竞赛中,我们期待看到闭源大模型深扎产业,让AI的智能力量真正飞入“千万家”,也期待着开源大模型根深叶茂,肆意生长为大模型的迭代、AI产业的发展开拓更多的想象空间。
标签:
- “四轮齐驱”解决群众就业难题
- 擦亮中医药“金字招牌” 成渝地区双城经济圈专家团“走进南川”活动顺利举行
- 142家中国企业上榜2023年《财富》世界500强
- 《逐梦》第三集:用青春和热血守卫祖国
- 8月3日 9:45分 昊帆生物(301393)股价快速拉升
- 大众朗逸、零跑C系列分别降价,下半年的价格战会更激烈吗?
- 邮报:曼城同意7800万镑引进格瓦迪奥尔,将其视为未来十年主力
- 银之杰:截至2023年7月31日,公司股东人数为52,242户
- 鲁信创投: 公司重点聚焦生物医药、半导体、装备制造和新材料等专精赛道
- 扬子新材原总经理遭10年市场禁入
- 九丰能源(605090.SH):目前公司在氦气方面致力于扩大氦的产销量,助力氦资源的国产化
- 风吹芦苇诗句 芦苇的诗句
- AMD Zen5架构全面普及:笔记本端最高16个核心
- 海贼王1089漫画图:路飞和索隆受伤,约克大哭求救,黄猿悠哉吃面
- 恒瑞医药回应网传“办事处被端”:目前没有该情形
- 拉布拉多价格幼犬 拉布拉多价格
- 只为百姓早一刻用电 河北涞水争分夺秒抢修电路
- 中金公司:存量按揭降息对银行负面影响有限
- 显示器面板类型va和ips哪个好
- 券商观点|月酝知风之银行业:政策加码推动预期改善,估值修复仍有空间
- 中秋节送的鸭子可以吃吗?
- 天源环保:公司目前在手订单30亿 后期将会陆续确认收入
- 中金:存量按揭降息对银行负面影响有限
- α-烯基磺酸钠商品报价动态(2023-08-02)
- 报告:暑期国内外热门自驾游目的地名单公布
- 逐梦电竞圈之后
- 贵州茅台上半年营收净利齐增逾20%创新高 直销占比超四成
- 病娇姐姐不想放过我(5)(病娇/逆推)
- 职场百态:螃蟹与鲸鱼,你更像哪一种?
- 网红基金经理25年迭代史:王亚伟两度问鼎冠军,千亿顶流跌落神坛
- 贵阳:降低第二次住房公积金贷款最低首付款比例至20%
- 政府“小投入” 企业“大回报” “双录”签名为企业开办注入加速度
- 2023年8月2日外汇交叉货币对行情分析
- 恒大物业:8月3日股票复牌
- 每体:巴萨不甘心只拿2500万欧,登贝莱转会可能闹上法庭
- 向佐晒一家四口迪士尼度假照,为郭碧婷打伞显殷勤,两人眼神拉丝
- 博实股份(002698):8月2日北向资金减持182.26万股
- 凯恩碎片已集齐?拜仁今夏出售3将+外租努贝尔,获9500万欧
- 鸿蒙4发布前 华为上线HDC 2023手机主题:免费下载 锁屏充电特效酷炫
- 和田墨玉墨绿色
- 和田玉墨玉籽料贵不贵
- 快手高开逾6%,预期2023年Q2期内盈利将不低于人民币14.36亿元
- 男子因撑伞“羞耻”被晒伤?医生提示晒伤不止于晒黑
- 印度一高速公路工地起重机倒塌致17人死亡
- 【歌词/平假名/罗马音】ベロア(Velour)-KALEIDOSCORE
- 不排除“卡努”紧擦沿海北上或登陆,浙江启动防台Ⅲ级响应
- 威马农机将于8月3日开启申购 发行价29.5元/股募集资金将超7亿元
- 博德之门3行李被偷任务完成方法
- (新华全媒+)(14)因强降雨被困北京门头沟的列车旅客陆续安全转移
- 掌握了政权,才能决定前进的方向
- 中国电信怀化分公司:强化举措 严守安全生产红线
- 东鹏控股(003012.SZ):红杉系股东拟减持不超4%股份
- 新疆召开主题教育整改整治工作推进会
- 请支持49号作品-宿州隐宿 | 安徽省乡村民宿创意设计大赛落地项目设计邀您打CALL!
- LSP大社死!《街霸6》比赛中主办方用了全裸MOD被直播曝光……
- 楼房公摊面积包括哪些(取消公摊面积的影响有哪些)
- 风起南沙岸,潮涌大湾区 广发银行助力南沙跑出高质量发展“加速度”
- “重车压梁”保安全!93辆大型车辆驶上跨永定河铁路桥
- 蔚来汽车加速“出弯”重回增长轨道 7月份交付20462辆同增104%创新高
- 储备地块“新妆”迎亚运
- 合伙财产份额可以进行出质吗?有什么限制性条件
- 强军 只争朝夕
- 土耳其记者:为重回贝西克塔斯效力,塔利斯卡愿意降薪
- 思想方面个人总结 学习方面的个人总结
- 杰伦格林、小波特2换1交易曝光,1.7亿锋卫摇摆人或空降休斯顿
- 哈理工荣成校区分数线2023(哈理工荣成校区分数线)
- 沾边常温超导?多家公司:不,没有!
- ToyotaSupra终于来了已经正式上线了
- 迅雷打不开网址 迅雷打不开
- papi酱生子被骂完整视频(papi酱生子)
- 这类产品爆火,谁是背后大买手?
- 打新必读:威马农机、司南导航申购,铭利转债申购
- 斜率是什么意思通俗易懂 斜率是什么
- 国航远洋:外贸大力拓展非煤货种 积极推动船舶在态势感知和检测方面的智能化工作
- 威马农机将于8月3日开启申购 发行价29.5元/股募集资金将超7亿元
- 上半年“库存减量”,京投发展发力销售与交付
- 掌握黄金方向 就能一劳永逸
- 上榜|吉林省这个救援团队拿了两项全国大奖,他们背后有啥故事
- 公羊救援队航空特勤队成功解救4个月大婴儿
- 安卓排名第一传奇手游推荐 传奇火龙神将多
- 联合攻关成果为保障电力供应装“定海神针”
- (成都大运会)覃海洋获成都大运会游泳男子100米蛙泳金牌
- 日本综艺办百公里超马 被喷为赚收视率毫无人性
- 破发股可孚医疗跌6.12% 上市即巅峰超募25亿元
- 还有雨,下班快回家!天津市气象台发布雷电黄色预警
- 梅西代言贵州白酒?客服回应:是真的!背后老板是化肥龙头
- 增长8.8%!海宁,稳进!
- 因暴雨受困的K396、K1178、Z180最后一批滞留旅客“回家”
- 8月3日起,平谷部分公交线路拟恢复运营
- 《暗黑破坏神4》不破电索之威能效果介绍
- 守望相助!三趟受阻旅客列车上的暖心故事
- 2023年上半年基本医保基金收入约1.63万亿元
- 爱博医疗与兆科眼科达成战略合作
- 最高法发布典型案例,明确支持正当行为免责
- 新华时评:“这身衣服”是防汛中的责任担当
- 北京市解除雷电黄色预警
- 书写新的青春故事
- 《茶叶包装产品质量国家监督抽查实施细则》发布
- 黑龙江南岔县楼房坍塌事故共造成4死4伤
- 秦岭大熊猫研究中心首只人工繁育大熊猫“楼生”迎来20岁生日