国内首个类ChatGPT模型:复旦大学MOSS今日正式开源,超100万条对话训练数据
复旦大学自然语言处理实验室开发的新版 MOSS 模型今日正式上线,成为国内首个插件增强的开源对话语言模型。
目前,MOSS 模型已上线开源,相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放,供科研人员下载。
(相关资料图)
据介绍,MOSS 是一个支持中英双语和多种插件的开源对话语言模型,moss-moon 系列模型具有 160 亿参数,在 FP16 精度下可在单张 A100 / A800 或两张 3090 显卡运行,在 INT4/8 精度下可在单张 3090 显卡运行。MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。
MOSS 来自复旦大学自然语言处理实验室的邱锡鹏教授团队,名字与《流浪地球》电影中的 AI 同名,已发布至公开平台(https://moss.fastnlp.top/),邀请公众参与内测。
查看 MOSS 的 GitHub 页面发现,该项目所含代码采用 Apache 2.0 协议,数据采用 CC BY-NC 4.0 协议,模型权重采用 GNU AGPL 3.0 协议。如需将该项目所含模型用于商业用途或公开部署,需要签署文件并发送至 robot@fudan.edu.cn 取得授权,商用情况仅用于记录,不会收取任何费用。
MOSS 用例:
▲ 解方程
▲ 生成图片
▲ 无害性测试
模型
moss-moon-003-base: MOSS-003 基座模型,在高质量中英文语料上自监督预训练得到,预训练语料包含约 700B 单词,计算量约 6.67x1022 次浮点数运算。
moss-moon-003-sft: 基座模型在约 110 万多轮对话数据上微调得到,具有指令遵循能力、多轮对话能力、规避有害请求能力。
moss-moon-003-sft-plugin: 基座模型在约 110 万多轮对话数据和约 30 万插件增强的多轮对话数据上微调得到,在 moss-moon-003-sft 基础上还具备使用搜索引擎、文生图、计算器、解方程等四种插件的能力。
moss-moon-003-pm: 在基于 moss-moon-003-sft 收集到的偏好反馈数据上训练得到的偏好模型,将在近期开源。
moss-moon-003: 在 moss-moon-003-sft 基础上经过偏好模型 moss-moon-003-pm 训练得到的最终模型,具备更好的事实性和安全性以及更稳定的回复质量,将在近期开源。
moss-moon-003-plugin: 在 moss-moon-003-sft-plugin 基础上经过偏好模型 moss-moon-003-pm 训练得到的最终模型,具备更强的意图理解能力和插件使用能力,将在近期开源。
数据
moss-002-sft-data: MOSS-002 所使用的多轮对话数据,覆盖有用性、忠实性、无害性三个层面,包含由 text-davinci-003 生成的约 57 万条英文对话和 59 万条中文对话。
moss-003-sft-data: moss-moon-003-sft 所使用的多轮对话数据,基于 MOSS-002 内测阶段采集的约 10 万用户输入数据和 gpt-3.5-turbo 构造而成,相比 moss-002-sft-data,moss-003-sft-data 更加符合真实用户意图分布,包含更细粒度的有用性类别标记、更广泛的无害性数据和更长对话轮数,约含 110 万条对话数据。目前仅开源少量示例数据,完整数据将在近期开源。
moss-003-sft-plugin-data: moss-moon-003-sft-plugin 所使用的插件增强的多轮对话数据,包含支持搜索引擎、文生图、计算器、解方程等四个插件在内的约 30 万条多轮对话数据。目前仅开源少量示例数据,完整数据将在近期开源。
moss-003-pm-data: moss-moon-003-pm 所使用的偏好数据,包含在约 18 万额外对话上下文数据及使用 moss-moon-003-sft 所产生的回复数据上构造得到的偏好对比数据,将在近期开源。
标签:
- 国内首个类ChatGPT模型:复旦大学MOSS今日正式开源,超100万条对话训练数据
- 【独家焦点】雪莉杨的真实身份_雪莉杨
- 上海银行间同业拆放利率Shibor涨跌互现 环球时讯
- 北京长峰医院火灾后被多家机构“除名”!此前曾获多个奖项-全球即时
- 纵观季后赛|一块“面包”,拯救了全NBA最烂的队|快播
- 今日最新!大宗交易:泰恩康成交2932.8万元,折价19.47%(04-20)
- 大宗交易:苏交科成交1107.14万元,折价15.62%(04-20) 环球聚看点
- 环球简讯:长城汽车:一季度归母净利润1.74亿元,同比下降89.34%
- 立昂微:一季度净利润3443.71万元 同比下降85.53%
- 木头姐:生成式 AI ChatGPT 可能会给用户提供不正确信息 快播
- 建立净零排放经济 到2050年需110万亿美元 世界头条
- 美国19名共和党议员联合致信拜登:停止对乌援助
- 环球讯息:机构调查:巴西经济增长预计2023年为0.9%,2024年为1.5%(1月调查为0....
- 世界观焦点:世界气象组织:过去8年全球平均温度是有记录以来的最高值
- 据基辅独立报:加拿大国防部宣布对乌克兰新的军事援助计划。援助计划包括向北约的...
- 碳酸锂跌价下的宁德时代:电池价格略降,"锂矿返利"推进成疑;一季度净利翻5倍
- 小岛交际花 晒同猫猫游戏《流浪》制作团队合影 天天速递
- 圣诺生物:子公司醋酸艾替班特注射液获药品注册证书_世界速递
- 【全球播资讯】齐心集团:4月20日召开董事会会议
- 久盛电气(301082.SZ):2022年度净利降10.16%至7900.38万元 拟10派2元 世界聚焦
- 百大集团(600865.SH)一季度扣非净利润2567.15万元、同比增长60.64% 资讯
- 天天热点评!不惜醉驾也要去见女友,结果半路车撞报废,人进铁窗|打非治违
- 天山雪莲怎么吃才比较好_天山雪莲四种简单做法分享
- 中字头迅速转头向上,中国卫通水下直线冲击涨停-观速讯
- 当前速递!欧洲央行管委雷恩:欧元区通胀率仍过高,不应该过早退出限制性货币政策
- 俄罗斯最大的镍生产商诺里尔斯克镍公司Nornickel:第一季度镍产量4.6667万吨
- 惠誉:由于费用竞争、成本通胀和欧洲投资经理的AUM较低,与费用相关的EBITDA利润率...
- 今日要闻!据俄新社引述克里姆林宫:俄罗斯总统普京和沙特王储在通话中讨论了欧佩克...
- 传奇组合!s1mple和内马尔线下CSGO开黑
- “星舰”爆炸后特斯拉领跌美股,马斯克身家一日缩水近千亿 华尔街分析师:还有下...
- 国内首个类ChatGPT模型:复旦大学MOSS今日
- 【独家焦点】雪莉杨的真实身份_雪莉杨
- 上海银行间同业拆放利率Shibor涨跌互现 环
- 北京长峰医院火灾后被多家机构“除名”!此
- 纵观季后赛|一块“面包”,拯救了全NBA最
- 今日最新!大宗交易:泰恩康成交2932.8万元
- 大宗交易:苏交科成交1107.14万元,折价15.
- 环球简讯:长城汽车:一季度归母净利润1.74
- 立昂微:一季度净利润3443.71万元 同比下
- 木头姐:生成式 AI ChatGPT 可能会给用
- 建立净零排放经济 到2050年需110万亿美元
- 美国19名共和党议员联合致信拜登:停止对乌
- 环球讯息:机构调查:巴西经济增长预计2023
- 世界观焦点:世界气象组织:过去8年全球平
- 据基辅独立报:加拿大国防部宣布对乌克兰新
- 碳酸锂跌价下的宁德时代:电池价格略降,"锂
- 小岛交际花 晒同猫猫游戏《流浪》制作团队
- 圣诺生物:子公司醋酸艾替班特注射液获药品
- 【全球播资讯】齐心集团:4月20日召开董事
- 久盛电气(301082.SZ):2022年度净利降10.16
- 百大集团(600865.SH)一季度扣非净利润2567.
- 天天热点评!不惜醉驾也要去见女友,结果半
- 天山雪莲怎么吃才比较好_天山雪莲四种简单
- 中字头迅速转头向上,中国卫通水下直线冲击
- 当前速递!欧洲央行管委雷恩:欧元区通胀率
- 俄罗斯最大的镍生产商诺里尔斯克镍公司Norn
- 惠誉:由于费用竞争、成本通胀和欧洲投资经
- 今日要闻!据俄新社引述克里姆林宫:俄罗斯
- 传奇组合!s1mple和内马尔线下CSGO开黑
- “星舰”爆炸后特斯拉领跌美股,马斯克身家