面向 AI 推断的 VCK5000 Versal 开发卡
产品描述
Xilinx® VCK5000 Versal™ 开发卡基于 Xilinx 7nm Versal™ ACAP 架构构建,旨在满足需要高吞吐量 AI 推断和信号处理计算性能的设计需求。
相较于当前服务器级 CPU,VCK5000 的计算能力提升了 100 倍,相较于当前服务器级 GPU,VCK5000 的 MLPerf 推断性能更佳,并且支持标准化开发流程,VCK5000 是云计算加速和边缘计算应用的理想开发平台。
VCK5000 完全由 Vitis™ AI 开发环境提供支持,包含优化的 IP、工具、库、模型和示例设计等。它采用高效易用的设计理念,可在 VCK5000 上充分发挥人工智能加速的潜力。您可以使用 Python 或 C++ API 在几分钟内运行 Tensorflow、Pytorch 或 Caffe 模型,无需事先掌握任何 FPGA 硬件知识。
主要特性与优势
优异的 AI 推断平台
145TOPS (Int8) @ $2,495
使用 AI 引擎进行 AI 推断,在 MLPerf 1.0 上优于 nVidia T4 的性能
随时可用的解决方案
带两个 DPU 变体解决方案的 Vitis AI 1.3(384 和 288 个 AIE 内核)
支持具有 50 多个模型的专区
自然语言 (BERT) 演示
MLPerf 提交 ResNet-50 演示(性能比 T4 高 11%)
使用 Vitis AI 启动设计,开发板用户指南
开发板特性
功耗与热量
卡规格 | VCK5000 | |
---|---|---|
器件 | VC1902 | |
计算 | 有源 | 无源* |
INT8 TOPs(峰值) | 145 | 145 |
尺寸 | ||
高度 | 完整 | 完整 |
长度 | 完整 | 3/4 |
宽度 | 双插槽 | 双插槽 |
存储器 | ||
片外内存容量 | 16 GB | 16 GB |
片外总带宽 | 102.4 GB/s | 102.4 GB/s |
内部 SRAM 容量 | 23.9 MB | 23.9 MB |
内部 SRAM 总带宽 | 23.5 TB/s | 23.5 TB/s |
接口 | ||
PCI Express | Gen3 x 16 / Gen4 x 8 | Gen3 x 16 / Gen4 x 8 |
网络接口 | 2x QSFP28 (100GbE) | 2x QSFP28 (100GbE) |
逻辑资源 | ||
查找表 (LUT) | 899,840 | 899,840 |
最大总功率 | 225W | 225W |
散热 | 活跃 | 无源 |