- 7.30 AM - 9.30 PM
- (001) 25465 258 369
中昊芯英发布了其新一代 TPU 芯片「须臾」,该芯片单芯片混合精度浮点算力达到了 896 TFLOPS,相较于上一代「刹那」芯片,性能提升了三倍。在 8-bit 推理算力方面,其表现高达 1792TOPS,能够满足大规模词元高并发推理的需求。
「须臾」芯片在显存容量和内部互联速率方面均有显著增强,并支持超长上下文处理。该芯片的额定功耗为 600W,与传统算力芯片相比,功耗降低了 50%,为绿色数据中心的构建提供了支持。
值得注意的是,「须臾」芯片的 IP 核、专用指令集、底层算子加速库以及整机系统软件均为完全自主研发,摆脱了对海外核心技术的依赖,能够符合政务、金融、电网等行业在安全合规方面的要求。
此外,中昊芯英还推出了高性能智算平台「泰则 2.0」。该平台以其标准的最小计算单元为核心,集成了两颗高性能 CPU 处理器和八片高性能 TPU 处理单元。其物理形态为一台通用 CPU 服务器外接一台高性能 TPU 算力加速设备,整体算力可达 7.168 PFLOPS(混合精度),且在执行相同任务时,整机能耗仅为传统 GPU 服务器的 80%。
在软件层面,「泰则 2.0」平台实现了对主流 AI 框架的全面兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。在训练方面,它适配了 DeepSpeed 和 Megatron-LM 分布式套件。目前,该平台已成功深度适配了 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型,使开发者能够高效地完成模型迁移工作。








世界杯赛程以世界杯直播为核心,带来高效便捷的体验。