RISC-V 跑大模型（二）：LLaMA零基础移植教程

这是RISC-V跑大模型系列的第二篇文章，主要教大家如何将LLaMA移植到RISC-V环境里。

1. 环境准备

1）最新版Python

2）确保机器有足够的内存加载完整模型（7B模型需要13~15G）

3）下载原版LLaMA模型和扩展了的中文模型

LLaMA原版模型：

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

2. 模型下载

从LLaMA原版模型地址上下载下述文件（我们使用的是7B）：

最后文件下载完成后的结果如下：

3. 加载并启动

1）这一步需要下载llama.cpp，请输入以下命令进行下载和编译：

git clone https://github.com/ggerganov/llama.cpp && cd llama.cpp && make

2）将第二步下载的文件移到llama.cpp/models/下，使用命令：

python3 convert-pth-to-ggml.py models/7B/ 0

3）将.pth模型权重转换为ggml的FP32格式，生成文件路径为models/7B/ggml-model-f32.bin。

4）运行./main二进制文件，-m命令指定Q4量化模型（也可加载ggml-FP16的模型）。以下是解码参数及示例：

./main models/7B/ggml-model-f32.bin --color -f prompts/alpaca.txt -ins -c 256 --temp 0.2 -n 128 --repeat_penalty 1.3

参数解释：

4.结束

本篇教程到这里就结束了。是不是觉得LLaMA的速度比较慢而且不支持中文，没关系，在下一期中，我们会为LLaMA扩充中文，并优化加速LLaMA，记得继续关注我们哦。

另外，RISC -V跑大模型系列文章计划分为四期：

1. RISC -V跑大模型（一）

2. RISC-V 跑大模型（二）：LLaMA零基础移植教程（本篇）

3. LLaMA扩充中文+优化加速（计划）

4. 更多性能优化策略。（计划）

如果有朋友在移植过程中遇到了问题，欢迎加群一起交流，一起搞大模型。

想尝试自己移植又没有RISC-V平台的小伙伴可以看看最近澎峰科技推出的“0元GO”活动，可以免费试用RISC-V，详情可以在下面的文章链接里了解。

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
ATXMEGA256A3BU-AU	1	Microchip Technology Inc	IC MCU 8BIT 256KB FLASH 64TQFP	ECAD模型下载ECAD模型	$8.44	查看
ATXMEGA32A4U-MHR	1	Microchip Technology Inc	IC MCU 8BIT 32KB FLASH 44VQFN		$2.99	查看
STM32H743XIH6	1	STMicroelectronics	High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals	ECAD模型下载ECAD模型	$31.15	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

ATXMEGA256A3BU-AU

Microchip Technology Inc

IC MCU 8BIT 256KB FLASH 64TQFP

$8.44

查看

ATXMEGA32A4U-MHR

Microchip Technology Inc

IC MCU 8BIT 32KB FLASH 44VQFN

$2.99

查看

STM32H743XIH6

STMicroelectronics

High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals

$31.15

查看

RISC-V 跑大模型（二）：LLaMA零基础移植教程

1. 环境准备

2. 模型下载

3. 加载并启动

4.结束

推荐器件

相关推荐