手机 > 品牌 > 华为

华为昇腾920b服务器部署DeepSeek翻车现场演示

126人参与 2025-02-19 华为

最近到祸一台huawei kunpeng 920 5250,先看看配置。之前是部署的讯飞大模型,发现资源利用率太低了。把5台减少到3台,就出了他

硬件配置信息

基本硬件信息

按照惯例先来看看配置。一共3块盘,500g的系统盘,+ 2块3t固态,后面把固态硬盘也组合成了逻辑卷

内存是1.5t的,比我电脑硬盘都大

[root@localhost ~]# lsblk
name                    maj:min rm   size ro type mountpoints
sda                       8:0    0 446.6g  0 disk 
├─sda1                    8:1    0   600m  0 part /boot/efi
├─sda2                    8:2    0     1g  0 part /boot
└─sda3                    8:3    0   445g  0 part 
  ├─openeuler-root      253:0    0    70g  0 lvm  /
  ├─openeuler-swap      253:1    0     4g  0 lvm  [swap]
  └─openeuler-home      253:2    0   371g  0 lvm  /home
nvme1n1                 259:0    0   2.9t  0 disk 
└─nvme1n1p1             259:4    0   2.9t  0 part 
  └─vg_data01-lv_data01 253:3    0   5.8t  0 lvm  /data
nvme0n1                 259:1    0   2.9t  0 disk 
└─nvme0n1p1             259:3    0   2.9t  0 part 
  └─vg_data01-lv_data01 253:3    0   5.8t  0 lvm  /data
[root@localhost ~]# df -th | awk '$2 !~ /overlay/ && $2 !~ /tmpfs/'
文件系统                        类型      容量  已用  可用 已用% 挂载点
/dev/mapper/openeuler-root      ext4       69g   45g   21g   69% /
/dev/sda2                       ext4      974m   72m  835m    8% /boot
/dev/sda1                       vfat      599m  5.8m  594m    1% /boot/efi
/dev/mapper/openeuler-home      ext4      365g  4.6g  342g    2% /home
/dev/mapper/vg_data01-lv_data01 ext4      5.8t  4.3t  1.3t   78% /data
[root@localhost ~]# cat /etc/os-release 
name="openeuler"
version="22.03 lts"
id="openeuler"
version_id="22.03"
pretty_name="openeuler 22.03 lts"
ansi_color="0;31"
[root@localhost ~]# uname -a
linux localhost.localdomain 5.10.0-60.18.0.50.oe2203.aarch64 #1 smp wed mar 30 02:43:08 utc 2022 aarch64 aarch64 aarch64 gnu/linux
[root@localhost ~]# lscpu
架构:               aarch64
  cpu 运行模式:     64-bit
  字节序:           little endian
cpu:                 192
  在线 cpu 列表:    0-191
厂商 id:            hisilicon
  bios vendor id:    hisilicon
  型号名称:         kunpeng-920
    bios model name: huawei kunpeng 920 5250
    型号:           0
    每个核的线程数: 1
    每个座的核数:   48
    座:             4
    步进:           0x1
    frequency boost: disabled
    cpu 最大 mhz:   2600.0000
    cpu 最小 mhz:   200.0000
    bogomips:       200.00
    标记:           fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop asimddp asimdfhm ssbs
caches (sum of all): 
  l1d:               12 mib (192 instances)
  l1i:               12 mib (192 instances)
  l2:                96 mib (192 instances)
  l3:                192 mib (8 instances)
numa:                
  numa 节点:        8
  numa 节点0 cpu:   0-23
  numa 节点1 cpu:   24-47
  numa 节点2 cpu:   48-71
  numa 节点3 cpu:   72-95
  numa 节点4 cpu:   96-119
  numa 节点5 cpu:   120-143
  numa 节点6 cpu:   144-167
  numa 节点7 cpu:   168-191
vulnerabilities:     
  itlb multihit:     not affected
  l1tf:              not affected
  mds:               not affected
  meltdown:          not affected
  spec store bypass: mitigation; speculative store bypass disabled via prctl
  spectre v1:        mitigation; __user pointer sanitization
  spectre v2:        not affected
  srbds:             not affected
  tsx async abort:   not affected
[root@localhost ~]# free -h
               total        used        free      shared  buff/cache   available
mem:           1.5ti        12gi        26gi        20mi       1.4ti       1.5ti
swap:          4.0gi        12mi       4.0gi

npu/gpu信息

由于没有部署任何ai、模型,所以空载着

[root@localhost ~]# npu-smi info
+------------------------------------------------------------------------------------------------+
| npu-smi 24.1.rc1                 version: 24.1.rc1                                             |
+---------------------------+---------------+----------------------------------------------------+
| npu   name                | health        | power(w)    temp(c)           hugepages-usage(page)|
| chip                      | bus-id        | aicore(%)   memory-usage(mb)  hbm-usage(mb)        |
+===========================+===============+====================================================+
| 0     910b3               | ok            | 89.7        35                0    / 0             |
| 0                         | 0000:c1:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 1     910b3               | ok            | 88.6        38                0    / 0             |
| 0                         | 0000:c2:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 2     910b3               | ok            | 91.8        36                0    / 0             |
| 0                         | 0000:81:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 3     910b3               | ok            | 87.2        36                0    / 0             |
| 0                         | 0000:82:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 4     910b3               | ok            | 88.8        41                0    / 0             |
| 0                         | 0000:01:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 5     910b3               | ok            | 95.7        44                0    / 0             |
| 0                         | 0000:02:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 6     910b3               | ok            | 93.5        39                0    / 0             |
| 0                         | 0000:41:00.0  | 0           0    / 0          3160 / 65536         |
+===========================+===============+====================================================+
| 7     910b3               | ok            | 89.2        40                0    / 0             |
| 0                         | 0000:42:00.0  | 0           0    / 0          3160 / 65536         |
+===========================+===============+====================================================+
+---------------------------+---------------+----------------------------------------------------+
| npu     chip              | process id    | process name             | process memory(mb)      |
+===========================+===============+====================================================+
| no running processes found in npu 0                                                            |
+===========================+===============+====================================================+
| no running processes found in npu 1                                                            |
+===========================+===============+====================================================+
| no running processes found in npu 2                                                            |
+===========================+===============+====================================================+

开始部署deepseek

ollama方法

根据网上资料看,只要用ollama部署就行,后面发现这个行不通。因为ollama只适配了英伟达的gpu,像华为的根本就行不通啊,

ollama的安装脚本也是去下载英伟达的驱动,结果就是下载失败,就算下载成功了也不能安装上去

https://zhuanlan.zhihu.com/p/22081569918

0

最后折腾了很久

使用 nohup ollama run

部署一个1.5b的试试,发现可以运行了。但是总觉得不对境。回答问题太慢了,用时3分钟。cpu使用率也是狂飙。npu是一点没有使上劲啊

ollama run deepseek-r1:1.5b

容器部署方法

最后决定下载权重+容器部署。结果这里就有遇到了坑点

需要用到git lfs 工具 和 华为的镜像。因为这是arm服务器,所有git lfs命令也很难找,欧拉的yum源还没有提供,最后翻来覆去在github最新的v3.6.1找到了。使用二进制命令接安装脚本既可以实现。这样就能通过git install ,git push 去拉取近1tb的权重了

https://github.com/git-lfs/git-lfs/releases

再说说这个华为的镜像吧,不得不吐槽。华为这是把镜像当宝贝供着吗,下载还需要申请权限,不是一般人还申请不下来。还好我们这里条件都满足

晚上提交的申请,第二天早上就通过了

最后参照了好几个教程,不是启动失败,就吃出现权限拒绝,服了

华为服务器社区:https://www.hiascend.com/software/modelzoo/models/detail/68457b8a51324310aad9a0f55c3e56e3

天翼云社区: https://www.ctyun.cn/document/10027724/10944583

部署r1模型提示不兼容…

天翼云社区: https://www.ctyun.cn/document/10027724/10944583

部署r1模型提示不兼容…

到此这篇关于华为昇腾920b服务器部署deepseek翻车现场演示的文章就介绍到这了,更多相关昇腾920b服务器部署deepseek内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(1)
打赏 微信扫一扫 微信扫一扫

您想发表意见!!点此发布评论

推荐阅读

299元! 华为星跃鼠标GT专业版发布:支持星闪 PAW3950

02-18

定价129元!支持双频 Wi-Fi 5的华为AX1路由器发布

02-20

OPPO Watch X2和华为Watch GT 5怎么选? 智能手表细节解析与选购指南

02-21

如何看待华为新出的AX1路由器? 华为AX1路由器首次拆机测评

02-24

国补后一加Ace 5 Pro和iQOO Neo 10怎么选? 两款手机区别对比

02-17

到手价6999元起! 华为Pura 70 Ultra影像实测体验

02-17

猜你喜欢

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论