> 技术文档 > 【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50

【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50


目录

  • 说在前面
  • 准备工作
  • Bios设置
    • 1. 关闭CSM
    • 2. 开启Above4G
  • 开启ssh
  • 显卡注意事项
  • 开机验证
  • 安装驱动
  • 其他
    • grub相关
    • 相关错误
    • 一些必要依赖
    • 参考

说在前面

  • 主板:未知x99
  • cpu:E5 2666v3
  • 显卡:RX 580 以及 Mi 50 32G
  • 系统:windows10 以及 ubuntu 22.04
  • 下一篇部署Qwen3

准备工作

  • 双系统(可选)
    这里我要保留原来的windows系统,所以选择安装了个双系统
    网上找一个教程将ubuntu 22.04安装到u盘或者其他介质
    如果不需要原来的windows,可以直接安装ubuntu
  • 亮机卡/核显
    需要图形界面来设置一下bios
  • 另一台正常使用的机器

Bios设置

  • bios设置最好是在单个系统的时候设置好,不然装了双系统后进入bios会比较麻烦

1. 关闭CSM

  • bios界面不太好截图,这里我让deepseek模拟了下bios界面做下示例:
    【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50
  • 选择Advanced
    【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50
  • CSM设置位Disabled,这里可能会遇到需要将UEFI Video设置为Disabled的提示,按照提示设置一下
    【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50
  • 设置完后bios界面可能会显示异常,比如我这里整个界面的颜色变成绿色了,不用管
  • 关闭CSM之后,我尝试将显卡插上开机,但是风扇启动了一下,然后停了,然后又启动了;电脑似乎没有启动,ping不通,ssh连接不上

2. 开启Above4G

  • 同样,选择PCI Configuration,将Above 4G设置为Enabled
    【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50
  • 开启这个后,似乎就能正常开机了

开启ssh

  • ubuntu装好后检查ssh状态
    sudo systemctl status ssh
  • 如果没有服务,安装一下
    sudo apt install openssh-server

    启动

    sudo systemctl start ssh

显卡注意事项

  • 上述准备好之后,将亮机卡卸下,装上mi 50
  • mi 50功率较高,确保电源功率足够
  • mi 50使用双8pin接口,确保线缆够用
  • 插上显卡后若出现尖锐蜂鸣声,检查显卡电源接口是否插好
  • mi 50散热比较差,如果没有准备好显卡风扇,建议备好空调或者其他风扇

开机验证

  • 显卡插好后开机,由于我们没有给mi 50刷视频输出bios,这个时候mini dp也是没有用的,只能通过远程连接
  • 在另一台电脑中ssh连接上去
    ssh 用户名@局域网ip
  • 使用lspci命令查看
    $ lspci |grep Dis05:00.0 Display controller: Advanced Micro Devices, Inc. [AMD/ATI] Vega 20 [Radeon Pro VII/Radeon Instinct MI50 32GB] (rev 01)

    可以看到识别到了mi 50显卡

安装驱动

  • 官网
    【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50

  • 找一个适用于22.04的
    【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50

  • 右键Download,复制下载链接,然后使用ssh终端上执行(记住,版本至少要5.5,如下是6.0):

     wget https://repo.radeon.com/amdgpu-install/23.40.1/ubuntu/jammy/amdgpu-install_6.0.60001-1_all.deb

    【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50

  • 安装

    sudo apt install ./amdgpu-install_6.0.60001-1_all.deb

    【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50
    【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50
    等待…
    【瞎折腾/mi50 32G/ubuntu】mi50显卡ubuntu运行大模型开坑(一)显卡准备以及驱动安装_ubuntu mi50

  • 安装rocm

    sudo amdgpu-install --usecase=hip,hiplibsdk,rocm --no-dkms
  • 验证

    hipconfigHIP version : 6.0.32831-204d35d16== hipconfigHIP_PATH : /opt/rocm-6.0.1ROCM_PATH : /opt/rocm-6.0.1HIP_COMPILER : clangHIP_PLATFORM : amdHIP_RUNTIME : rocclrCPP_CONFIG : -D__HIP_PLATFORM_HCC__= -D__HIP_PLATFORM_AMD__= -I/opt/rocm-6.0.1/include -I/opt/rocm-6.0.1/lib/llvm/lib/clang/17.0.0== hip-clangHIP_CLANG_PATH : /opt/rocm-6.0.1/llvm/binAMD clang version 17.0.0 (https://github.com/RadeonOpenCompute/llvm-project roc-6.0.1 24012 af27734ed982b52a9f1be0f035ac91726fc697e4)Target: x86_64-unknown-linux-gnuThread model: posixInstalledDir: /opt/rocm-6.0.1/llvm/binConfiguration file: /opt/rocm-6.0.1/lib/llvm/bin/clang++.cfgAMD LLVM version 17.0.0git Optimized build. Default target: x86_64-unknown-linux-gnu Host CPU: haswell Registered Targets: amdgcn - AMD GCN GPUs r600 - AMD GPUs HD2XXX-HD6XXX x86 - 32-bit X86: Pentium-Pro and above x86-64 - 64-bit X86: EM64T and AMD64hip-clang-cxxflags : -isystem \"/opt/rocm-6.0.1/include\" -O3hip-clang-ldflags : --driver-mode=g++ -O3 --hip-link --rtlib=compiler-rt -unwindlib=libgcc=== Environment VariablesPATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin== Linux KernelHostname : lele-X99M-GamingLinux xxxxNo LSB modules are available.Distributor ID: UbuntuDescription: Ubuntu 22.04.5 LTSRelease: 22.04Codename: jammy
  • 注意 ,重启后可能会识别不了GPU,执行一下以下命令

    sudo modprobe amdgpu

其他

grub相关

  • 如果装了双系统,在启动后会进入grub引导,在选择操作系统界面按下Esc会进入命令行,输入fwsetup进入bios
    grub > fwsetup

相关错误

  • cmath
    CMake Error at /usr/share/cmake-3.22/Modules/CMakeTestHIPCompiler.cmake:65 (message): The HIP compiler \"/opt/rocm-5.4.6/llvm/bin/clang\" is not able to compile a simple test program. It fails with the following output: Change Dir: /home/lele/llama.cpp-master/build/CMakeFiles/CMakeTmp Run Build Command(s):/usr/bin/gmake -f Makefile cmTC_01461/fast && /usr/bin/gmake -f CMakeFiles/cmTC_01461.dir/build.make CMakeFiles/cmTC_01461.dir/build gmake[1]: 进入目录“/home/lele/llama.cpp-master/build/CMakeFiles/CMakeTmp” Building HIP object CMakeFiles/cmTC_01461.dir/testHIPCompiler.hip.o /opt/rocm-5.4.6/llvm/bin/clang --cuda-host-only --offload-arch=gfx906 -o CMakeFiles/cmTC_01461.dir/testHIPCompiler.hip.o -c /home/lele/llama.cpp-master/build/CMakeFiles/CMakeTmp/testHIPCompiler.hip In file included from <built-in>:1: /opt/rocm-5.4.6/llvm/lib/clang/15.0.0/include/__clang_hip_runtime_wrapper.h:50:10: fatal error: \'cmath\' file not found #include  ^~~~~~~ 1 error generated when compiling for host. gmake[1]: *** [CMakeFiles/cmTC_01461.dir/build.make:78:CMakeFiles/cmTC_01461.dir/testHIPCompiler.hip.o] 错误 1 gmake[1]: 离开目录“/home/lele/llama.cpp-master/build/CMakeFiles/CMakeTmp” gmake: *** [Makefile:127:cmTC_01461/fast] 错误 2 CMake will not be able to correctly generate this project.Call Stack (most recent call first): ggml/src/ggml-hip/CMakeLists.txt:36 (enable_language)

    安装

    sudo apt install libstdc++-12-dev

一些必要依赖

  • 这些
    sudo apt install git libcurl4-openssl-dev libstdc++-12-dev

参考

  • gfx1030
  • cmath not found
  • amdgpu install
  • rocm install doc
  • amd ubuntu apt repo