感谢IT之家网友 航空先生 的线索投递!
,王小川旗下百川智能今日发布 Baichuan-13B 大模型,号称“130 亿参数开源可商用”。
据官方介绍,Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含 130 亿参数的开源可商用的大规模语言模型,在中英文 Benchmark 上均取得同尺寸模型中最好的效果。本次发布包含有预训练 和对齐 (Baichuan-13B-Chat) 两个版本。
官方宣称,Baichuan-13B 有如下几个特点:
-
更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到 130 亿,并且在高质量的语料上训练了 1.4 万亿 tokens,超过 LLaMA-13B40%,是当前开源 13B 尺寸下训练数据量最多的模型。支持中英双语,使用 ALiBi 位置编码,上下文窗口长度为 4096。
-
同时开源预训练和对齐模型:预训练模型是适用开发者的『 基座 』,而广大普通用户对有对话功能的对齐模型具有更强的需求。因此项目中同时具有对齐模型,具有很强的对话能力,开箱即用,几行代码即可简单地部署。
-
更高效的推理:为了支持更广大用户的使用,项目中同时开源了 int8 和 int4 的量化版本,相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛,可以部署在如英伟达 RTX3090 这样的消费级显卡上。
-
开源免费可商用:Baichuan-13B 不仅对学术研究完全开放,开发者也仅需邮件申请并获得官方商用许可后,即可以免费商用。
目前该模型已经在 HuggingFace、GitHub、Model Scope 公布,感兴趣的 IT之家小伙伴们可以前往了解。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

-
盘扣式脚手架有哪些优点?四川远方模架告诉你答案!新浪网消息:四川远方模架科技有限公司位于四川省成都市,创建于2017年。公司拥有M60型盘扣脚手架总量达30000余吨,具有...
-
区块链如何跨越未来10年“十四五”时期,随着全球数字化进程的深入推进,区块链产业竞争将更加激烈。作为新兴数字产业之一,区块链在产业变革中发挥着重要作...
-
三人篮球将首登奥运舞台 国家三人男女篮签署反兴奋剂为实现东京奥运会兴奋剂问题“零出现”的目标,近日,中国篮协反兴奋剂委员会分别前往山东济南和上海崇明训练基地,为国家三人男、女...
-
健康体检进工地情暖一线建设者
2023-07-12 12:52
-
明光通用机场项目开展项目经理带班综合检查
2023-07-12 12:51
-
TIOBE发布7月编程语言排行榜:C++即将超越C,
2023-07-12 12:49
-
英特尔酷睿i7-14700K处理器跑分流出:多核性能
2023-07-12 12:32
-
踔厉奋发正当时!中国二十二冶集团华东公司奋力建设上海
2023-07-12 12:27
-
上海移动举办5·17世界电信日发布会
2023-07-12 12:27
-
什么是摄影中的二次构图?怎样使用二次构图?
2023-07-12 12:21
-
特斯拉同意支付600万美元,结束太阳能屋顶涨价有关诉
2023-07-12 12:12
-
Twitter搜索屏蔽Threads链接
2023-07-12 12:09
-
估值超160亿,「国产自动驾驶芯片第一股」,”黑芝麻
2023-07-12 11:53