,AI 模型盲堆体积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款 13 亿参数的语言模型 phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的 GPT 3.5”。
IT之家注意到,该模型以 Transformer 架构为基础,微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”,以及 8 个英伟达 A100 GPU,在短短 4 天内完成训练。
微软团队表示,比起增加模型的参数量,通过提高模型的训练数据集质量,也许更能强化模型的准确率和效率,于是,他们利用高质量数据训练出了 phi-1 模型。在测试中,phi-1 的分数达到 50.6%,比起 1750 亿参数的 GPT-3.5还要好。
微软表示,phi-1 接下来会在 HuggingFace 中开源,而这不是微软第一次开发小型 LLM,此前,他们打造一款 130 亿参数的 Orca,使用了 GPT-4 合成的数据训练而成,表现也同样比 ChatGPT 更好。
目前关于 phi-1 的论文已经在 arXiv 中发布,可以在这里找到论文的相关内容。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
-
盘扣式脚手架有哪些优点?四川远方模架告诉你答案!新浪网消息:四川远方模架科技有限公司位于四川省成都市,创建于2017年。公司拥有M60型盘扣脚手架总量达30000余吨,具有...
-
区块链如何跨越未来10年“十四五”时期,随着全球数字化进程的深入推进,区块链产业竞争将更加激烈。作为新兴数字产业之一,区块链在产业变革中发挥着重要作...
-
三人篮球将首登奥运舞台 国家三人男女篮签署反兴奋剂为实现东京奥运会兴奋剂问题“零出现”的目标,近日,中国篮协反兴奋剂委员会分别前往山东济南和上海崇明训练基地,为国家三人男、女...
-
连云港:购买首套住房公积金贷款首付比例最低降至20%
2023-06-28 14:34
-
华硕推出BR1402F笔记本电脑:军工制作标准、全功
2023-06-28 14:24
-
第十四届夏季达沃斯论坛与会嘉宾:携手合作才能实现互利
2023-06-28 14:20
-
英国跑车大厂牵手美国“造车新势力”,阿斯顿马丁将与L
2023-06-28 14:05
-
中科慧居集团宣布完成数千万人民币A+轮融资
2023-06-28 14:03
-
亚马逊正式推出美国版“最后一公里”配送方案:请小企业
2023-06-28 13:45
-
中国移动发布两颗自研通信芯片
2023-06-28 13:38
-
起亚首款纯电轿跑车EV6今日开启盲订:限量1000台
2023-06-28 13:33
-
中建玖合北京区域在唐山丰润区开展端午节主题实践活动
2023-06-28 13:30
-
中铁十一局二公司十堰片区开展主题道德讲堂活动
2023-06-28 13:28
最新