- 概述特点
- 规格参数
- 资料下载
- 订购方式
-
硬核算力,流畅支撑7B级大模型离线推理
- 搭载20TOPS(INT8)高算力NPU,支持INT4/INT8/FP16混合精度推理,兼顾运算精度与效率。
- 单卡可独立离线运行3B/7B级大语言/多模态模型,兼容Qwen、LLaMA2等主流开源模型,覆盖智能对话、视觉识别、多模态感知等场景。
- 3B模型实测推理速度可达100+token/s,本地推理流畅低延迟,无需依赖网络,保障边缘AI业务稳定运行。
3D 堆叠高带宽内存
采用 3D 堆叠 DRAM 架构,内置 2.5/5 GB DRAM,摒弃传统外挂 DDR 方案,从硬件层面优化数据传输效率。内存带宽可达数百 GB 级别,较传统外置 DDR 带宽大幅提升,彻底攻克端侧大模型 “内存墙、带宽墙” 痛点。
解耦架构:专芯专用,不抢资源
算力卡负责 AI 推理运算,不运行系统、不抢占主控 CPU、带宽、内存资源,从底层杜绝系统卡顿、资源冲突问题。分工清晰高效,RK3588/RK3576/RK3568/RK3572 等主控负责系统运行、外设控制、视频编解码、网络传输等基础业务;算力卡专职承担 AI 推理、算法分析工作。双单元并行协同、互不干扰,大幅提升设备整体稳定性与业务运行效率。
低功耗、高性价比
算力对标 Jetson Orin Nano,具备更低功耗、更优成本,端侧大模型表现突出,是边缘中小算力场景的优选。
灵活扩展,升级方便
RK1828 内置 DDR,数据搬运效率大幅提升,对外带宽依赖极低,仅需 PCIe 2.1 1Lane 即可满血发挥 AI 算力。
软件生态友好,降低开发落地门槛
适配主流深度学习框架,原生支持 RKNN、TensorFlow、PyTorch、ONNX,各类训练模型可快速转换无缝迁移,兼容性极强。完整 RKNN SDK,大模型优化好。
标准 M.2 通用封装,极简集成快速落地
采用标准 M.2 通用封装,尺寸规范、接口统一,作为协处理单元可灵活对接多款主流主控平台。硬件集成简洁高效,无需复杂改造,即可快速为系统扩展 AI 算力,显著降低产品开发与部署成本。
持续更新的用户资料
一站式获取完整软硬件开发资源,加速产品原型验证与量产落地
-
AI 加速模块 · 技术规格
M.2 2280 形态 | 边缘计算旗舰 | 高能效 NPU处理器RK1820 / RK1828RAM内置 2.5GB / 5GB接口M.2 M-Key尺寸M.2 2280支持主控RK3568 / RK3576 / RK3588算力20 Tops支持系统Linux、Android计算精度NT4 INT8 INT16 FP8 FP16 BF16支持的模型视觉模型 声音模型 时序预测模型 大语言模型 多模态模型 -



