万万没想到,谷歌 PaLM 竟被开源了,但是微缩版的。
谷歌未开源的 PaLM,网友竟给开源了。
昨天,一位开发者在 GitHub 上开源了三种微缩版的 PaLM 模型:参数分别为 1.5 亿,4.1 亿(PalM-410m)和 10 亿(PalM-1b)。
这三种模型在谷歌 C4 数据集进行了训练,上下文长度为 8k。未来,还有 20 亿参数的模型正在训练中。
使用 4.1 亿参数模型生成的示例:
My dog is very cute, but not very good at socializing with other dogs. The dog loves all new people and he likes to hang out with other dogs. I do need to take him to the park with other dogs. He does have some bad puppy breath, but it is only when he runs off in a direction he doesn't want to go. currently my dog is being very naughty. He would like to say hi in the park, but would rather take great care of himself for a while. He also has bad breath. I am going to have to get him some oral braces. It's been 3 months. The dog has some biting pains around his mouth. The dog is very timid and scared. The dog gets aggressive towards people. The dog is very playful and they are a little spoiled. I am not sure if it's a dog thing or if he is spoiled. He loves his toys and just wants to play. He plays with his toys all the time and even goes on walks. He is a little picky, not very good with other dogs. The dog is just a little puppy that goes to the park. He is a super friendly dog. He has not had a bad mouth or bad breath
我的狗很可爱,但是不善于和其他狗交际。这只狗喜欢所有新来的人,他喜欢和其他的狗一起玩。我确实需要带他和其他狗一起去公园。他确实有点小狗的口臭,但只有当他往不想去的方向跑的时候。现在我的狗很淘气。他想在公园里打个招呼,但宁愿好好照顾自己一段时间。他还有口臭。我得给他买个口腔矫正器,已经过去三个月了。这条狗嘴边有些咬痕疼痛。这只狗非常胆小和害怕。这只狗对人有攻击性。这条狗非常顽皮,他们有点被宠坏了。我不确定是狗的问题还是他被宠坏了。他喜欢他的玩具,只是想玩。他总是玩他的玩具,甚至去散步。他有点挑剔,不太会和其他狗相处。那只狗只是一只去公园的小狗。它是一只超级友好的狗。他没有口臭问题了。
虽然参数确实有点少,但这生成的效果还是有些一言难尽……
这些模型兼容许多 Lucidrain 的流行仓库,例如 Toolformer-pytorch、PalM-rlhf-pytorch 和 PalM-pytorch。
最新开源的三种模型都是基线模型,并将在更大规模数据集上进行训练。
所有的模型将在 FLAN 上进一步调整指令,以提供 flan-PaLM 模型。
开源的 PaLM 模型通过 Flash Attention、Xpos Rotary Embeddings 进行训练,从而实现了更好的长度外推,并使用多查询单键值注意力机制进行更高效的解码。
在优化算法方面,采用的则是解耦权重衰减 Adam W,但也可以选择使用 Mitchell Wortsman 的 Stable Adam W。
目前,模型已经上传到 Torch hub,文件也存储在 Huggingface hub 中。
如果模型无法从 Torch hub 正确下载,请务必清除 .cache/ torch / hub/中的检查点和模型文件夹。如果问题仍未解决,那么你可以从 Huggingface 的仓库下载文件。目前,Huggingface 的整合工作正在进行中。
所有的训练数据都已经用 GPTNEOX 标记器进行了预标记,并且序列长度被截止到 8192。这将有助于节省预处理数据的大量成本。
这些数据集已经以 parquet 格式存储在 Huggingface 上,你可以在这里找到各个数据块:C4 Chunk 1,C4 Chunk 2,C4 Chunk 3,C4 Chunk 4,以及 C4 Chunk 5。
在分布式训练脚本中还有另一个选项,不使用提供的预标记 C4 数据集,而是加载和处理另一个数据集,如 openwebtext。
安装
在尝试运行模型之前,需要先进行一波安装。
你可以通过使用 Torch hub 加载预训练的模型进行额外的训练或微调:
model=torch.hub.load.cuda()
另外,你还可以通下面的方式直接加载 PyTorch 模型检查点:
frompalm_rlhf_pytorchimportPaLMmodel=PaLM.cuda()model.load('/palm_410m_8k_v0.pt')
要使用模型生成文本,可以使用命令行:
prompt-用于生成文本的提示。
seq _ len-生成文本的序列长度,默认值为 256。
temperature-采样温度,默认为 0.8
filter_thres-用于采样的过滤器阈值。默认值为 0.9。
model-用于生成的模型。有三种不同的参数:palm_150m_8k_v0,palm_410m_8k_v0,palm_1b_8k_v0。
python3inference.py"Mydogisverycute"--seq_len256--temperature0.8--filter_thres0.9--model"palm_410m_8k_v0"
如果你想通过添加流处理或其他功能来扩展生成,作者提供了一个通用的推理脚本「inference.py」。
训练
这几个「开源 PalM」模型是在 64 个 A100GPU 上完成训练的。
为了方便模型的训练,作者还提供了一个分布式训练脚本 train_distributed.py。
你可以自由改变模型层和超参数配置以满足硬件的要求,并且还可以加载模型的权重并改变训练脚本来微调模型。
最后,作者表示会在将来加入一个具体的微调脚本,并对 LoRA 进行探索。
数据
可以通过运行 build_dataset.py 脚本,以类似于训练期间使用的 C4 数据集的方式预处理不同的数据集。这将对数据进行预标记,将数据分成指定序列长度的块,并上传到 Huggingface hub。
比如:
python3build_dataset.py--seed42--seq_len8192--hf_account"your_hf_account"--tokenizer"EleutherAI/gpt-neox-20b"--dataset_name"EleutherAI/the_pile_deduplicated"PaLM 2 要来了
2022 年 4 月,谷歌首次官宣了 5400 亿参数的 PaLM。与其他 LLM 一样,PaLM 能执行各种文本生成和编辑任务。
PaLM 是谷歌首次大规模使用 Pathways 系统将训练扩展到 6144 块芯片,这是迄今为止用于训练的基于 TPU 的最大系统配置。
它的理解能力拔群,不仅连笑话都能看懂,还能给看不懂的你解释笑点在哪。
就在 3 月中,谷歌首次开放其 PaLM 大型语言模型 API。
这意味着,人们可以用它来完成总结文本、编写代码等任务,甚至是将 PaLM 训练成一个像 ChatGPT 一样的对话聊天机器人。
在即将召开的谷歌年度 I / O 大会上,劈柴将公布公司在 AI 领域的最新发展。
据称,最新、最先进的大型语言模型 PaLM 2 即将推出。
PaLM 2 包含 100 多种语言,并一直在内部代号「统一语言模型」下运行。它还进行了广泛的编码和数学测试以及创意写作。
上个月,谷歌表示,其医学 LLM「Med-PalM2」,可以回答医学考试的问题,在「专家医生水平」,准确率为 85% 。
此外,谷歌还将发布大模型加持下的聊天机器人 Bard,以及搜索的生成式体验。
最新 AI 发布能否让谷歌挺直腰板,还得拭目以待。
参考资料:
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
环旭电子毛利率创上市十年新低,股价跌跌不休,连续回购有
图片来源:图虫3月28日,环旭电子(601231.SH)披露2021年年度报告称,该公司去...
两个20CM涨停,津荣天宇拟10转8派3,上市没满周年
图片来源:图虫创意3月29日,津荣天宇(300988.SZ)再次“20CM涨停”,收于44...
在管面积翻倍,碧桂园服务称大规模收并购已过去
图片来源:碧桂园服务结束过去一年来的大举收并购后,在3月29日召开的2021年度业绩发布会...
首套房利率降至5.2%,武汉楼市政策也放松了
去年被投资客们看好的武汉楼市,近期也继续出台了楼市刺激政策。界面新闻获悉,武汉房贷利率出现...
英国通胀创30年来最快增速,政府宣布立即降调燃油税
2022年3月9日,英国丹伯里,埃克森美孚公司运营的埃索加油站。图片来源:视觉中国英国政府...
让孩子自信互动才是幼儿园质量“金标准”
让孩子自信互动才是幼儿园质量“金标准” “入园难、入园贵”的问题终于不那么令人焦灼了。近年...
佳通轮胎获行业“十大轮胎品牌”等奖项
近日,由中国轮胎商务网发起主办、善养汽车联合主办的ApexTire2021中国轮胎年度大选...
快手2021年营收811亿元,调整后净亏损188.5亿
,快手今日公布了2021年第四季度及全年财报。财报显示,该公司第四季度营收244亿元,同比...
奇安信2022年新增订单超9亿元同比增长超65%
3月29日,奇安信发布关于近期经营情况的公告。公告显示,目前公司在手订单超23亿元,202...
大摩:苹果、谷歌等大型科技企业股票反弹,亚马逊、英伟达
北京时间3月29日早间消息,据报道,摩根士丹利财富管理公司表示,美国主要的科技和互联网股票...
万科蝉联第一2022房企综合实力TOP500测评成果出
3月29日,2022房地产开发企业综合实力测评成果正式发布,“房地产开发企业综合实力TOP...
华为加码芯片研发:海思升格为一级部门
华为本周发布2021年年度报告,从华为2021年的最新业务架构来看,海思已经从2012实验...
LGDisplay加码抢占中国透明显示市场
LGDisplay于3月29日至31日在北京东外56号文创园,以“YourLifewith...
一汽-大众奥迪赛车队加冕中国超级跑车锦标赛2021赛季
2022年3月24日,代表一汽-大众奥迪赛车队出征中国超级跑车锦标赛(ChinaGT)20...
StrategyAnalytics:
根据StrategyAnalytic...
增程技术成2022百人会热门增程式S
3月27日,中国电动汽车百人会论坛(...
工信部:1-2月份我国软件业务收入1
近日,工信部发布《2022年1-2月...
元宇宙进行时,高通在行动
近期,高通宣布设立总金额达1亿美元的...
Ultrasuede®携手智己L7打
环保可持续发展的理念不断融于各行各业...