据悉,numenta采用了一种新颖的方法来提高cpu性能,毫无疑问的,对整个科技行业来说,这意味着ai硬件军备竞赛的最新转折。
numenta已经证明,通过应用一种最新方法,英特尔cpu在人工智能工作负载上的性能可以远远超过目前最好的cpu和gpu。据serve the home报道,这家初创公司使用了一系列基于这一理念的技术,并以numenta智能计算平台(nupic)为品牌,在人工智能推理方面解锁了传统cpu的新性能水平。
真正令人惊讶的是,它的性能明显优于专门为处理人工智能推理而设计的gpu和cpu。例如,numenta采用了nvidia报告的a100 gpu性能数据的工作负载,并在增强型48核第四代sapphire rapids cpu上运行。在所有场景中,根据总吞吐量,它都比nvidia的芯片更快。事实上,它比第三代intel xeon处理器快64倍,比a100 gpu快10倍。
利用神经科学提升人工智能性能
numenta作为一家成立于2005年的公司,专门致力于复制人类大脑的功能,并将其用于人工智能领域,其创始人创始人杰夫·哈金斯是美国著名发明家、计算机科学家和神经科学家,美国工程院院士。2004年,他出版了一本科普著作《on intelligence》,把人工智能这个陌生概念播撒到无数人的心里。
事实上本次突破也是其经过长达17年的深入大脑研究,nupic标志着其终于迈出了这一人工智能领域重要的里程碑,将ai的处理效率提高100倍,并为开发人员和企业提供了更高的灵活性和控制权,同时确保了数据的安全性和隐私性。
此前的十几年间,numenta以其受神经科学启发的人工智能工作负载方法而闻名,它严重依赖稀疏计算的理念——这就是大脑在神经元之间形成连接的方式。
如今,大多数cpu和gpu都是为密集计算而设计的,尤其是人工智能,这比大脑神经元工作的模式更加“暴力”。尽管众多事实证明这是提高性能的必由之路,但cpu却无法以这种方式良好工作。这就是numenta发挥作用的地方。
这家初创公司希望通过将其“秘密武器”应用于通用cpu,而不是专门为处理以人工智能为中心的工作负载而构建的芯片,从而释放人工智能模型中稀疏计算的效率增益。
虽然它可以在cpu和gpu上工作,但numenta采用了intel xeon cpu,并应用了其高级矢量扩展(avx)-512和高级矩阵扩展(amx),因为英特尔的芯片是目前最可用的。这些是x86架构的扩展——作为额外的指令集,可以让cpu执行更苛刻的功能。
numenta使用docker容器提供nupic服务,并且可以在公司自己的服务器上运行。如果它在实践中发挥作用,这将是重新利用数据中心中已部署的cpu来处理ai工作负载的最佳凯发app的解决方案,特别是考虑到nvidia业界领先的a100和h100 gpu的等待时间较长。