,清华大学电子工程系日前与字节跳动的火山语音团队携手合作,推出一款开源大语言模型 SALMONN。
IT之家经过查询得知,SALMONN 模型支持语音、音频以及音乐输入,它可以感知和理解不同类型的音频内容输入,并具备多语言语音识别和翻译以及语音推理等功能。
官方表示,SALMONN 支持语音、音频以及音乐输入,它可以感知和理解不同类型的音频内容输入,并具备多语言语音识别和翻译以及语音推理等功能。
官方同时表示,目前 SALMONN 能够胜任英语语音识别、英语到中文的语音翻译、情感识别、音频字幕生成、音乐描述等重要的语音和音频任务,同时又涌现出多种在模型训练中没有专门学习过的多语言和跨模态能力,涵盖非英语语音识别、英语到其他语言的语音翻译、对语音内容的摘要和关键词提取、基于音频的故事生成、音频问答、语音和音频联合推理等任务。
目前该模型已经发布于 GitHub 中,官方同时放出了项目的 Demo 链接,感兴趣的小伙伴们可以前往了解。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
-
盘扣式脚手架有哪些优点?四川远方模架告诉你答案!新浪网消息:四川远方模架科技有限公司位于四川省成都市,创建于2017年。公司拥有M60型盘扣脚手架总量达30000余吨,具有...
-
区块链如何跨越未来10年“十四五”时期,随着全球数字化进程的深入推进,区块链产业竞争将更加激烈。作为新兴数字产业之一,区块链在产业变革中发挥着重要作...
-
三人篮球将首登奥运舞台 国家三人男女篮签署反兴奋剂为实现东京奥运会兴奋剂问题“零出现”的目标,近日,中国篮协反兴奋剂委员会分别前往山东济南和上海崇明训练基地,为国家三人男、女...
-
格莱斯抖音直播+探店新媒体特色渠道宣传,引爆终端流量
2023-08-23 15:06
-
《宝可梦朱/紫:零之秘宝》公布抹茶宝可梦“斯魔茶”介
2023-08-23 15:05
-
口碑最好的奶粉排名里合生元派星奶粉精耕保护力成分深受
2023-08-23 15:03
-
研究团队开发“BrightMarker”隐形标签系统
2023-08-23 14:59
-
摩尔线程发布显卡Windows驱动v230.40:正
2023-08-23 14:47
-
女性特有生理机制会使心血管疾病风险升高专家:牢记AB
2023-08-23 14:43
-
山东威海:增加无房职工租房提取公积金频次
2023-08-23 14:37
-
工信部等部门印发《新产业标准化领航工程实施方案》,2
2023-08-23 14:17
-
修图工具Photomator3.1发布:引入Smar
2023-08-23 14:16
-
《啪嗒砰》精神续作《Ratatan》开发商接受采访,
2023-08-23 14:06
最新