【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50
目录
- 说在前面
- 准备工作
- Bios设置
-
- 1. 关闭CSM
- 2. 开启Above4G
- 开启ssh
- 显卡注意事项
- 开机验证
- 安装驱动
- 其他
-
- grub相关
- 相关错误
- 一些必要依赖
- 参考
说在前面
- 主板:未知x99
- cpu:E5 2666v3
- 显卡:RX 580 以及 Mi 50 32G
- 系统:windows10 以及 ubuntu 22.04
- 下一篇部署Qwen3
准备工作
- 双系统(可选)
这里我要保留原来的windows系统,所以选择安装了个双系统
网上找一个教程将ubuntu 22.04安装到u盘或者其他介质
如果不需要原来的windows,可以直接安装ubuntu - 亮机卡/核显
需要图形界面来设置一下bios - 另一台正常使用的机器
Bios设置
- bios设置最好是在单个系统的时候设置好,不然装了双系统后进入bios会比较麻烦
1. 关闭CSM
- bios界面不太好截图,这里我让deepseek模拟了下bios界面做下示例:
- 选择
Advanced
- 将
CSM
设置位Disabled
,这里可能会遇到需要将UEFI Video
设置为Disabled
的提示,按照提示设置一下
- 设置完后bios界面可能会显示异常,比如我这里整个界面的颜色变成绿色了,不用管
- 关闭CSM之后,我尝试将显卡插上开机,但是风扇启动了一下,然后停了,然后又启动了;电脑似乎没有启动,ping不通,ssh连接不上
2. 开启Above4G
- 同样,选择
PCI Configuration
,将Above 4G
设置为Enabled
- 开启这个后,似乎就能正常开机了
开启ssh
- ubuntu装好后检查ssh状态
sudo systemctl status ssh
- 如果没有服务,安装一下
sudo apt install openssh-server
启动
sudo systemctl start ssh
显卡注意事项
- 上述准备好之后,将亮机卡卸下,装上mi 50
- mi 50功率较高,确保电源功率足够
- mi 50使用双8pin接口,确保线缆够用
- 插上显卡后若出现尖锐蜂鸣声,检查显卡电源接口是否插好
- mi 50散热比较差,如果没有准备好显卡风扇,建议备好空调或者其他风扇
开机验证
- 显卡插好后开机,由于我们没有给mi 50刷视频输出bios,这个时候mini dp也是没有用的,只能通过远程连接
- 在另一台电脑中ssh连接上去
ssh 用户名@局域网ip
- 使用
lspci
命令查看$ lspci |grep Dis05:00.0 Display controller: Advanced Micro Devices, Inc. [AMD/ATI] Vega 20 [Radeon Pro VII/Radeon Instinct MI50 32GB] (rev 01)
可以看到识别到了mi 50显卡
安装驱动
-
官网
-
找一个适用于22.04的
-
右键Download,复制下载链接,然后使用ssh终端上执行(记住,版本至少要5.5,如下是6.0):
wget https://repo.radeon.com/amdgpu-install/23.40.1/ubuntu/jammy/amdgpu-install_6.0.60001-1_all.deb
-
安装
sudo apt install ./amdgpu-install_6.0.60001-1_all.deb
等待…
-
安装rocm
sudo amdgpu-install --usecase=hip,hiplibsdk,rocm --no-dkms
-
验证
hipconfigHIP version : 6.0.32831-204d35d16== hipconfigHIP_PATH : /opt/rocm-6.0.1ROCM_PATH : /opt/rocm-6.0.1HIP_COMPILER : clangHIP_PLATFORM : amdHIP_RUNTIME : rocclrCPP_CONFIG : -D__HIP_PLATFORM_HCC__= -D__HIP_PLATFORM_AMD__= -I/opt/rocm-6.0.1/include -I/opt/rocm-6.0.1/lib/llvm/lib/clang/17.0.0== hip-clangHIP_CLANG_PATH : /opt/rocm-6.0.1/llvm/binAMD clang version 17.0.0 (https://github.com/RadeonOpenCompute/llvm-project roc-6.0.1 24012 af27734ed982b52a9f1be0f035ac91726fc697e4)Target: x86_64-unknown-linux-gnuThread model: posixInstalledDir: /opt/rocm-6.0.1/llvm/binConfiguration file: /opt/rocm-6.0.1/lib/llvm/bin/clang++.cfgAMD LLVM version 17.0.0git Optimized build. Default target: x86_64-unknown-linux-gnu Host CPU: haswell Registered Targets: amdgcn - AMD GCN GPUs r600 - AMD GPUs HD2XXX-HD6XXX x86 - 32-bit X86: Pentium-Pro and above x86-64 - 64-bit X86: EM64T and AMD64hip-clang-cxxflags : -isystem \"/opt/rocm-6.0.1/include\" -O3hip-clang-ldflags : --driver-mode=g++ -O3 --hip-link --rtlib=compiler-rt -unwindlib=libgcc=== Environment VariablesPATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin== Linux KernelHostname : lele-X99M-GamingLinux xxxxNo LSB modules are available.Distributor ID: UbuntuDescription: Ubuntu 22.04.5 LTSRelease: 22.04Codename: jammy
-
注意 ,重启后可能会识别不了GPU,执行一下以下命令
sudo modprobe amdgpu
其他
grub相关
- 如果装了双系统,在启动后会进入grub引导,在选择操作系统界面按下
Esc
会进入命令行,输入fwsetup
进入biosgrub > fwsetup
相关错误
- cmath
CMake Error at /usr/share/cmake-3.22/Modules/CMakeTestHIPCompiler.cmake:65 (message): The HIP compiler \"/opt/rocm-5.4.6/llvm/bin/clang\" is not able to compile a simple test program. It fails with the following output: Change Dir: /home/lele/llama.cpp-master/build/CMakeFiles/CMakeTmp Run Build Command(s):/usr/bin/gmake -f Makefile cmTC_01461/fast && /usr/bin/gmake -f CMakeFiles/cmTC_01461.dir/build.make CMakeFiles/cmTC_01461.dir/build gmake[1]: 进入目录“/home/lele/llama.cpp-master/build/CMakeFiles/CMakeTmp” Building HIP object CMakeFiles/cmTC_01461.dir/testHIPCompiler.hip.o /opt/rocm-5.4.6/llvm/bin/clang --cuda-host-only --offload-arch=gfx906 -o CMakeFiles/cmTC_01461.dir/testHIPCompiler.hip.o -c /home/lele/llama.cpp-master/build/CMakeFiles/CMakeTmp/testHIPCompiler.hip In file included from <built-in>:1: /opt/rocm-5.4.6/llvm/lib/clang/15.0.0/include/__clang_hip_runtime_wrapper.h:50:10: fatal error: \'cmath\' file not found #include ^~~~~~~ 1 error generated when compiling for host. gmake[1]: *** [CMakeFiles/cmTC_01461.dir/build.make:78:CMakeFiles/cmTC_01461.dir/testHIPCompiler.hip.o] 错误 1 gmake[1]: 离开目录“/home/lele/llama.cpp-master/build/CMakeFiles/CMakeTmp” gmake: *** [Makefile:127:cmTC_01461/fast] 错误 2 CMake will not be able to correctly generate this project.Call Stack (most recent call first): ggml/src/ggml-hip/CMakeLists.txt:36 (enable_language)
安装
sudo apt install libstdc++-12-dev
一些必要依赖
- 这些
sudo apt install git libcurl4-openssl-dev libstdc++-12-dev
参考
- gfx1030
- cmath not found
- amdgpu install
- rocm install doc
- amd ubuntu apt repo