清华大学发布大模型综合性能评估报告：文心一言排名第二，通义千问排名第六 -凯发app

快讯

清华大学发布大模型综合性能评估报告：文心一言排名第二，通义千问排名第六

来源：财联社
2023-08-08 20:10

据公众号“清元宇宙”，清华大学沈阳教授团队近日发布了《大语言模型综合性能评估报告》，报告从生成质量、使用与性能、安全与合规三个维度对大语言模型进行评估，并深入分析不同大语言模型之间的优劣。

清华大学发布大模型综合性能评估报告：文心一言排名第二，通义千问排名第六

据公众号“清凯发app”，清华大学沈阳教授团队近日发布了《大语言模型综合性能评估报告》，报告从生成质量、使用与性能、安全与合规三个维度对大语言模型进行评估，并深入分析不同大语言模型之间的优劣。

该报告总共对文心一言、讯飞星火、通义千问、昆仑天工、gpt-4、chatgpt 3.5 和 claude 七个大语音模型进行了评估分析。据综合性能评估结果显示，gpt-4 排名第一，文心一言和 chatgpt 3.5 分别排名第二三位，阿里云通义千问则排在第六位。

关键词

相关阅读

苹果开始招募生成式 ai 人才，提供数十个大模型岗位

60

苹果开始招募生成式 ai 人才，提供数十个大模型岗位

by
2023-08-08

蒙牛发布首个全球营养健康领域模型

60

蒙牛发布首个全球营养健康领域模型

by
2023-08-08

易点天下与阿里云达成合作，联合打造行业专属大模型

60

易点天下与阿里云达成合作，联合打造行业专属大模型

by
2023-08-08

ai大模型来袭，智能客服变天？

60

ai大模型来袭，智能客服变天？

by
2023-08-07

元宇宙和大模型都少不了nvidia

60

元宇宙和大模型都少不了nvidia

by
2023-08-07

美踏控股发布虚拟人音舞社交人工智能大数据模型“心乐舞河”

60

美踏控股发布虚拟人音舞社交人工智能大数据模型“心乐舞河”

by
2023-08-07

ai大模型加持，全新鸿蒙智能座舱“遥遥领先”了吗？

60

ai大模型加持，全新鸿蒙智能座舱“遥遥领先”了吗？

by
2023-08-05

聆心智能发布超拟人大模型，使ai兼具“智商”与“情商”

60

聆心智能发布超拟人大模型，使ai兼具“智商”与“情商”

by
2023-08-05

美踏控股发布虚拟人音舞社交人工智能大数据模型“心乐舞河”

60

美踏控股发布虚拟人音舞社交人工智能大数据模型“心乐舞河”

by
2023-08-05

华为：小艺将具备ai大模型能力

60

华为：小艺将具备ai大模型能力

by
2023-08-04

24快报

chao起大鲍岛，畅游元宇宙，体验里院“一天一百年”

今天 11:06

中日韩元宇宙高尔夫跨国明星赛，打造亚洲数字竞技新高度

今天 11:03

利亚德参展国际“声光视讯显元宇宙”全产业盛会

今天 11:02

工商银行申请基于元宇宙的资源转移专利，提高了资源转移的效率和

今天 11:01

重庆渝中区：数字化演绎传统经典将国风之美融入元宇宙

今天 10:51

全球首个国家级“元宇宙”平台沙特上线主要用于在线旅游

今天 10:50

沙特推出世界首个国家级“元宇宙”平台，用户可线上游览当地景点

今天 10:48

《元梦之星》元宵节再上央视，星搭子们在“小小元宇宙”共庆佳节

今天 10:47

捷安高科：为河南省元宇宙协会副会长单位及专精特新中小企业，获

今天 10:46

乐华娱乐签约元隆雅图开展ip衍生品及元宇宙等方面合作

今天 10:46

ude2024盛大开幕，开年首展蓄势声、光、视、讯、显、元宇宙六大

今天 10:40

重庆：4200 亿元，支持企业研发元宇宙产品，打造特色产业园

今天 10:38

周鸿祎：“元宇宙”概念明年可能会东山再起

昨天 12:57

借力roblox东京造本土元宇宙名片，国内文旅可以学到什么

昨天 12:56

sora“加速”元宇宙发展，sora 一站式3d数字内容创作工具，将成

昨天 12:46

北京首个元宇宙“沉浸式”红色主题教育课程开讲

昨天 12:44

何鸿婷郑一卉：对我国新闻传播学元宇宙研究的反思

昨天 12:43

sora 一站式3d数字内容创作工具,元宇宙的内容快速建构时代即将到

2024年2月23日 16:23

元宇宙的喜与忧

2024年2月23日 10:28

开启元宇宙的“钥匙”有了合肥造合肥加快打造具有国际领先优势

2024年2月23日 10:27

json抓取失败