微软投资的初创公司d-Matrix推出高性能人工智能芯片Corsair
时间:2024-11-20 16:48
小编:小世评选
在人工智能快速发展的背景下,硬件的升级迭代显得尤为重要。近日,硅谷初创公司d-Matrix宣布推出其首款人工智能芯片Corsair,并且这款芯片已经开始出货。值得一提的是,d-Matrix获得了微软的投资支持,这为其技术研发提供了坚实的后盾。Corsair芯片的发布,不仅标志着d-Matrix在AI芯片领域的一次重要突破,也为未来AI推理计算的效率提升奠定了基础。
据d-Matrix介绍,Corsair芯片的设计针对AI推理运算的特性进行了深度优化。在单台服务器上,该芯片可以为Llama3 8B模型提供每秒处理60000个tokens的强劲性能,同时确保每个token仅需1毫秒的延迟。这种高效的处理能力为需要快速响应的人工智能应用提供了更多可能,尤其是在实时数据分析、自然语言处理等领域,其应用前景更加广阔。
在当前的计算环境中,AI推理运算常常面临数据传输的瓶颈。为了高效完成推理任务,处理器不仅需要大量的内存支撑,同时也要求内存的访问速度极快。这两者之间的矛盾一直令人困扰,许多传统的解决方案未能有效应对这一挑战。
目前业界普遍采用的解决方案有三种:第一种是通过数据采样和流水线处理来减少需要处理的数据量,从而加速深度学习过程。这一方法在提高速度的同时也不可避免地牺牲了准确性和精确性。第二种方案则是将专用AI引擎与传统处理器集成,这种方法已经被苹果、英伟达、英特尔和AMD所采用。尽管这种方案在一定程度上提高了处理效率,但由于集成了SRAM和外部DRAM,依然存在高能耗和效率低下的问题。
d-Matrix则选择了一种全新的技术架构,即数字存算一体(DIMC)。这一架构将计算移动至内存附近,大幅降低了数据传输的延迟和能耗,显著提升了AI推理运算的效率。由于AI推理运算过程中涉及大型且相对静态的权重数据集,DIMC技术能够有效消除能量转移费用和数据移动延迟,使得Corsair芯片在处理速度和能效方面都具备巨大的优势。
得益于DIMC架构,Corsair芯片实现了150TB/s的超高内存带宽,处理交互速度提高了10倍,能效更是提升了3倍,这为各种AI应用的发展打开了新的大门。同时,Corsair芯片的设计兼容性十分优秀,采用了业内标准的PCIe Gen5全高全长卡外形,可以通过DMX Bridge卡轻松连接多张卡,实现强大的计算能力。
每张Corsair卡都由多个DIMC计算核心驱动,具备2400 TFLOP的8位峰值计算能力。Corsair芯片还配备了2GB的集成性能内存,并支持高达256GB的片外容量内存。这一组合使得Corsair不仅能处理庞大的数据集,还能够在复杂的AI模型推理中保持较低的延迟和高效率。
随着Corsair芯片的推出,d-Matrix在AI硬件领域的格局也随着之发生变化。它的发布不仅展示了公司在技术创新上的潜力,更表明了硅谷在推动人工智能技术发展的持续努力。作为一项新兴技术,数字存算一体的架构有望引领未来AI芯片设计的发展潮流,推动更高性能、高效率的AI计算设备的诞生。
Corsair芯片的问世为AI推理计算提供了一种全新的解决方案,促进了人工智能技术的进步。随着AI应用需求的不断增长,这一新型芯片或将成为推动行业发展的重要力量。未来,随着技术的不断演进,d-Matrix及其Corsair芯片将继续迎来更多的机遇与挑战,值得行业内外的高度关注。