在世界互联网大会乌镇峰会期间,李彦宏发言指出,繁荣的ai原生应用生态,将推动新一轮的经济增长。从头开始训练大模型到到开发好用可用的大模型,存在很高的技术壁垒和成本门槛,重复造轮会给社会资源造成极大的浪费。李彦宏举例,即使像微软这样的大型公司,也没有去开发自己的基础模型,而是与openai合作。
微软在ai大模型应用上采取的方法论,对国内厂商的参考价值有几分?国内大厂的踊跃入局,ai大模型的蜂拥而至,对行业意味着什么?这些大模型正式面向公众以后,能否扛住来自c端和市场的考验?
据新浪vr了解,目前国内已有超过20个大模型正式通过《生成式人工智能服务管理暂行办法》备案,面向社会开放。此前,今年8月首批通过备案的ai大模型包括百度文心一言、百川智能、商汤商量sensechat、抖音(云雀大模型)、智谱ai(glm大模型)、中科院(紫东太初大模型)、上海minimax(abab大模型)、上海人工智能实验室(书生通用大模型)、“360智脑”等。
再加上本月有11家公司宣布其研发的ai大模型通过备案,包括网易有道(“子曰”大模型)、蚂蚁集团(百灵大模型)、面壁智能(面壁露卡luca)、出门问问(序列猴子)、昆仑万维(“天工”大模型)、美团、知乎(“知海图ai”模型)、月之暗面(moonshot ai)、金山办公(wps ai)、好未来(mathgpt大模型)、360公司(奇元大模型)。
大模型应用,场景为先。新浪vr关注到,月之暗面、面壁智能这两家公司为初创企业,研发团队来自清华大学。其他9家为垂直领域的头部企业,包括互联网生活服务、金融科技、网络安全、国产办公软件、教育等领域。新浪vr对本批次公开的大模型展开调研。
从技术到生态,分给初创企业的“蛋糕”够大吗?
10月份,moonshot ai带着首个支持输入20万汉字的智能助手产品kimi chat亮相在公众视野。据悉,这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度,标志着moonshot ai在“长文本”这一重要技术上取得了领先水平。支持更长的上下文意味着大模型拥有更大的“内存”,从而使得大模型的应用更加深入和广泛,例如通过多篇财报进行市场分析、处理超长的法务合同、快速梳理多篇文章或多个网页的关键信息、基于长篇小说设定进行角色扮演等方面。
据悉,moonshot ai创立于2023年3月,致力于寻求将能源转化为智能的最优解,通过产品与用户共创智能。创始团队核心成员参与了google gemini、google bard、盘古nlp、悟道等多个大模型的研发,多项核心技术被google palm、meta llama、stable diffusion等主流产品采用。moonshot ai融资超2亿美元。
面壁露卡luca于今年5月正式推出,是面壁智能基于其自研千亿参数基座模型cpm打造的多模态智能对话助手。经过多次迭代更新,luca不仅在中英文语言对话方面有所突破,还具备代码、知识、逻辑及图片理解能力。据悉,此外,面壁智能还联合清华大学nlp实验室、openbmb开源社区打造了一个“三位一体”的大模型产学研生态布局,目前已为数百家企业提供商用服务,覆盖金融、商业、工业、医疗、教育、法律、媒体等行业。
面壁智能成立于2022年8月,总部位于北京,深耕通用ai领域,专注大模型技术创新与应用转化。公司拥有人工智能领域享有盛誉的清华系研发创始团队,依托在自然语言处理方面的多项世界级前沿技术,正在构建大规模预训练模型库及配套工具旨在推进大模型技术与应用标准化。面壁露卡luca的发布,令面壁智能在人工智能科技领域受到广泛关注。
大模型之于教育,找到突破“内卷”的关键拼图
在大模型技术落地应用的场景中,教育始终备受关注。首先,大量的教学数据、对个性化学习的强烈需求,让人们对ai 教育有很大的想象空间;其次,教育扮演着引导社会前进的关键角色。当谈及大模型在教育领域的应用之时,在探讨一项技术的落地之余,更应当思考如何利用技术创造更好的教育体验。
其中,“子曰”教育大模型已官宣六大应用成果,包括虚拟人口语教练hi echo、llm翻译、ai作文指导、语法精讲、aibox、文档问答。相比于通用大模型,“子曰”作为教育垂类大模型拥有更专业的预训练语料,可以依据用户在学习场景下的需求,向其提供对话式大语言模型。据新浪vr了解,基于该模型,有道为不同学习场景设计了定制化的模型,以实现模型与场景的契合。
另一个教育领域的垂直大模型为学而思大模型mathgpt,由好未来推出。mathgpt专攻教育和学习场景下ai能力的训练和优化。据介绍,学而思学习机陆续上线的功能包括ai对话学、ai讲题助手、中英文写作助手等。其中“ai对话学”通过多轮对话的方式将精准学定位到步骤级,无论是准确度还是个性化程度上,都实现了代际化的提升。
大厂加码多端触达,集体挖掘“冰山之下”的需求
蚂蚁集团发布的百灵语言大模型,采用了transfromer架构,基于万亿级token语料训练而成,支持窗口长度达32k,推理能力领先,在主流推理类榜单中排名前列,在算力、安全力和知识力上表现突出。据悉,在基础大模型层面,除了本次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型并已内测。
得益于出门问问在通用大模型上的研发能力,“序列猴子”以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度。奇妙文是一款基于“序列猴子”的ai写作应用,能够满足职场办公、市场营销、新媒体和创意写作等创作需求,支持续写、改写、扩写、缩写、提炼要点、风格转换、纠错、翻译等写作功能。
昆仑万维宣布开源百亿级大语言模型“天工”skywork-13b系列,并配套开源了600gb、150b tokens的超大高质量开源中文数据集。据了解,昆仑万维“天工”skywork-13b系列目前包括130亿参数的两大模型:skywork-13b-base模型、skywork-13b-math模型,它们在ceval, gsm8k等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力出色,在中文科技、金融、政务等领域表现优异。
近日,知乎宣布其“知海图ai”大模型将面向公众开放,并择机上线相关产品,以提供服务给创作者、讨论场所、信息获取者以及内容运营者等各类型用户。据介绍,“知海图ai”大模型的训练主要是基于cpm企业级大模型与modelforce大模型系统,拥有千亿级参数,并且有更强的逻辑推理能力和更快的推理速度。
360方面,从大模型定位和应用角度来看,此次通过备案的奇元大模型具备充足的灵活性和可扩展性,商业化方向和产品定位以b端用户为主,后期将会聚焦更多的商业化应用和垂直领域,帮助企业、机构提升工作效率。此前,360智脑大模型已于今年9月首批获得备案开放,该大模型集成了360gpt大模型、360多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,覆盖大模型全部应用场景。至此,360公司也成为国内首家两个大模型均通过备案的科技企业。
美团方面,美团于今年7月花费数亿元投资ai大模型公司智谱华章。公开资料显示,智谱华章成立于2019年,由清华大学计算机系知识工程实验室的技术成果转化而来,曾参与研发超大规模预训练模型。目前,美团的ai大模型还未对外公布名称。据介绍,美团一直在扩张算法团队,并启动筹划单独的“平台部门”,帮助美团大模型通过具体的商业化形式落地。近期,美团在各大应用商店上线了一款名为“wow”的app,系美团首个ai产品。
在9月20日举办的2023金山办公技术开放日期间,金山办公ceo章元庆在发言中谈到,大模型将重新定义所有软件意味着什么:未来没有ai加持的软件,就像是手动挡燃油车,有ai大模型加持的可能更像 l4级智能驾驶的电动车,差别就是这么大。那么,对wps而言,接下来有三个发展方向,即aigc(内容创作)、copilot(智慧助理)和insight(知识洞察)。他希望将wps变得更简单,也许未来的工具栏只需一栏,所有的办公需求与流程都藏在这座“冰山之下”。
结语
ai大模型之战的背后,在于大型预训练模型成为ai领域的新趋势,这种模型具有极高的进入门槛,需要大量的数据、算力和人才支持。因此,这涉及到全球范围内的科技巨头和初创公司,是一场从技术到生态的全方位竞争。
新浪vr分析认为,目前国内的ai大模型已经在语言模型、芯片算力、自然语言处理、生成式ai、ai与物联网结合以及数据安全和隐私保护等方面取得了重要进展。但同时,大模型的发展也面临着诸多挑战,包括数据质量、计算资源、可解释性和透明度、安全和隐私以及场景适配性和应用落地等方面。为突破这些挑战,需要不断进行技术创新和研究探索,同时也需要加强与各行业的合作与交流,以推动ai大模型在更广泛的领域得到应用。