号称“史上最强的开源大语言模型”出现了。
它叫 Falcon,参数 400 亿,在 1 万亿高质量 token 上进行了训练。
最终性能超越 650 亿的 LLaMA,以及 MPT、Redpajama 等现有所有开源模型。
一举登顶 HuggingFace OpenLLM 全球榜单:
除了以上成绩,Falcon 还可以只用到 GPT-3 75% 的训练预算,性能就显著超越 GPT-3,且推理阶段的计算也只需 GPT-3 的 1/5。
据悉,这只半路杀出来的“猎鹰”来自阿联酋阿布扎比技术创新研究所 。
有意思的是,作为一个开源模型,TII 在 Falcon 上推出了一个相当特别的授权许可证要求:
可以商业使用,但如果用它产生的收益超过了 100 万美元,就要被收取 10% 的授权费。
一时之间,争议满满。
史上最强开源 LLM
据介绍,Falcon 属于自回归解码器模型。
它使用自定义工具构建,包含一个独特的数据管道,该管道从公开网络中提取训练数据。
——Falcon 宣称它“特别注重数据质量”,从公网上抓取内容构建好 Falcon 的初始预训练数据集后,再使用 CommonCrawl 转储,进行大量过滤并消除重复数据,最终得到一个由近 5 万亿个 token 组成的庞大预训练数据集。
为了扩大 Falcon 的能力,该数据集随后又加进了很多精选语料,包括研究论文和社交媒体对话等内容。
除了数据把关,作者还对 Falcon 的架构进行了优化以提升性能,但细节没有透露,相关论文将很快发布。
据悉,Falcon 一共耗费两个月,在 AWS 的 384 个 GPU 上训练而成。
最终,Falcon 一共包含 4 个版本:
Falcon-40B:在 1 万亿 token 上进行训练,并使用精选语料库进行了增强;主要接受英语、德语、西班牙语、法语的训练,不会中文。
Falcon-40B-Instruct:在 Baize 上进行了微调,使用 FlashAttention 和多查询对推理架构进行了优化,是一个即用型聊天模型。
Falcon-7B:参数 70 亿,在 1.5 万亿 token 上进行了训练,作为一个原始的预训练模型,还需要用户针对大多数用例进一步微调。
Falcon-RW-7B:参数 70 亿,在 3500 亿 token 上进行训练,该模型旨在用作“研究神器”,单独研究各种在网络数据进行训练的影响。
Falcon 作为开源模型,已公开源代码和模型权重,可供研究和商业使用。
这对业界来说是一个好消息,毕竟像 Meta 的羊驼家族都只能用于研究目的,且还得填表格申请才行,很是麻烦。
但 Falcon 还是引起了争议。
这主要是因为它那“超过 100 万美元的任何商业应用都要收 10% 的授权费”的许可证要求。
据悉,该许可证部分基于 Apache License 2.0 协议,该协议对商业应用友好,使用者修改代码只需满足相关需求即可将新作品作为开源或商业产品发布或销售。
有不少网友认为,既然 Falcon 宣称开源,还要收费,就违背了 Apache License Version 2.0 的宗旨,不属于真正的开源。
并有人称这是一种“有损 Apache 软件基金会来之不易的名誉”的做法。
有网友已经跑到 TII 的官方账号下“讨要说法”:
你自己能解释一下这是如何符合“开源”的定义吗?
目前,官方并没有回复。
你认为这种做法究竟算不算开源呢?
参考链接:
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
环旭电子毛利率创上市十年新低,股价跌跌不休,连续回购有
图片来源:图虫3月28日,环旭电子(601231.SH)披露2021年年度报告称,该公司去...
两个20CM涨停,津荣天宇拟10转8派3,上市没满周年
图片来源:图虫创意3月29日,津荣天宇(300988.SZ)再次“20CM涨停”,收于44...
在管面积翻倍,碧桂园服务称大规模收并购已过去
图片来源:碧桂园服务结束过去一年来的大举收并购后,在3月29日召开的2021年度业绩发布会...
首套房利率降至5.2%,武汉楼市政策也放松了
去年被投资客们看好的武汉楼市,近期也继续出台了楼市刺激政策。界面新闻获悉,武汉房贷利率出现...
英国通胀创30年来最快增速,政府宣布立即降调燃油税
2022年3月9日,英国丹伯里,埃克森美孚公司运营的埃索加油站。图片来源:视觉中国英国政府...
让孩子自信互动才是幼儿园质量“金标准”
让孩子自信互动才是幼儿园质量“金标准” “入园难、入园贵”的问题终于不那么令人焦灼了。近年...
佳通轮胎获行业“十大轮胎品牌”等奖项
近日,由中国轮胎商务网发起主办、善养汽车联合主办的ApexTire2021中国轮胎年度大选...
快手2021年营收811亿元,调整后净亏损188.5亿
,快手今日公布了2021年第四季度及全年财报。财报显示,该公司第四季度营收244亿元,同比...
奇安信2022年新增订单超9亿元同比增长超65%
3月29日,奇安信发布关于近期经营情况的公告。公告显示,目前公司在手订单超23亿元,202...
大摩:苹果、谷歌等大型科技企业股票反弹,亚马逊、英伟达
北京时间3月29日早间消息,据报道,摩根士丹利财富管理公司表示,美国主要的科技和互联网股票...
万科蝉联第一2022房企综合实力TOP500测评成果出
3月29日,2022房地产开发企业综合实力测评成果正式发布,“房地产开发企业综合实力TOP...
华为加码芯片研发:海思升格为一级部门
华为本周发布2021年年度报告,从华为2021年的最新业务架构来看,海思已经从2012实验...
LGDisplay加码抢占中国透明显示市场
LGDisplay于3月29日至31日在北京东外56号文创园,以“YourLifewith...
一汽-大众奥迪赛车队加冕中国超级跑车锦标赛2021赛季
2022年3月24日,代表一汽-大众奥迪赛车队出征中国超级跑车锦标赛(ChinaGT)20...
StrategyAnalytics:
根据StrategyAnalytic...
增程技术成2022百人会热门增程式S
3月27日,中国电动汽车百人会论坛(...
工信部:1-2月份我国软件业务收入1
近日,工信部发布《2022年1-2月...
元宇宙进行时,高通在行动
近期,高通宣布设立总金额达1亿美元的...
Ultrasuede®携手智己L7打
环保可持续发展的理念不断融于各行各业...