24-Deepseek大模型
24-DeepSeek大模型
本文将讲解如何使用 RKLLM 将提炼后的模型DeepSeek-R1-Distill-Qwen-1.5B部署到Rockchip平台,利用 NPU 进行硬件加速推理。
芯片平台:RK3576/RK3588
系统版本:Debian12/Debian11
一、开发环境搭建
RKLLM SDK 说明文档
RKNPU驱动
RKLLM-Toolkit
模型下载
runtime下载
二、部署运行
板端部署环境
百度网盘目录:3-SoftwareData软件资料 / rk35xx-rkllm-deepseek.tar.gz
测试包说明:
DeepSeek-R1-Distill-Qwen-1.5B.rkllm
是转换后的模型
llm_demo
是编译后的llm测试程序
拷贝测试包到RK3588
设置环境变量
运行测试
性能分析
对于数学问题:Solve the equations x+y=12, 2x+4y=34, find the values of x and y
,RK3588 实现每秒 14.93 个令牌。
阶段
总时间(毫秒)
代币
每个令牌的时间(毫秒)
每秒令牌数
预填
429.63
81
5.30
188.53
产生
56103.71
851
66.99
14.93
export RKLLM_LOG_LEVEL=1
Last updated