Notes
  • 简介
  • Linux
    • Ubuntu
      • Ubuntu 20.04 ARM64 修改PAGE_SIZE 64k
    • Samba
      • CentOS7安装Samba
      • 简单案例
      • 审计
      • 相关命令
    • Systemd
    • FPM 打包 nginx rpm 包
    • rpm 打包-从二进制文件进行打包
    • Centos7 重置密码
    • CentOS7搭建kvm并创建虚拟机
    • CentOS7-KVM 嵌套虚拟化
    • CentOS7 KVM GPU 穿透
    • Bonding
    • CentOS7 发送邮件
    • CentOS7 安装 OpenVPN
    • Linux 多线路由策略
    • Webmin 安装
    • NoVNC 安装
    • SRS-RTMP 服务部署
    • CentOS7 安装 MongoDB
    • confluence 安装
    • jira 安装
    • crowd 安装
    • ScriptRunner For Jira
    • ScriptRunner For Confluence
    • Ubuntu VNC
    • Ubuntu18.04-VNC 安装
    • deb 打包
    • iptables
    • debian 保持软件包一致
    • Ubuntu18.04 编译安装 grpc
    • CentOS7 安装 odoo13
    • Pacemaker 入门
    • Firewalld Rich Language
    • PHP Xdebug
    • CentOS7.3 编译安装 Python3.6
    • 葫芦儿打包
    • CentOS7 安装 Tomcat8
    • CentOS7 安装 JDK
    • GuacamoleServer 编译安装
    • FreeBSD7.0安装AMP
    • CentOS7 换源
    • deb下载并离线安装
    • pip下载并离线安装
  • Network
    • 案例一
  • AI
    • 微调Qwen2.5
    • Qwen2.5 VL AWQ量化
    • qwen2.5 填充权重
  • JavaScript
  • Zabbix
    • CentOS7 安装 Zabbix4.0 LTS
    • Zabbix 加密连接
    • Zabbix 主动和被动模式
    • Zabbix 配置邮件报警
    • Zabbix 监控 MySQL
  • 数据库
    • MySQL
      • CentOS7 Install MySQL5.7
      • MySql 主从配置
      • CentOS7 安装 Percona XtraDB Cluster
      • MySql 压力测试-sysbench
      • MariaDB Galera Cluster
      • 备份脚本
    • MongoDB
      • 启用账号密码登录
      • 备份脚本
  • Nginx
    • CentOS7 安装 Nginx
    • Nginx 配置
    • nginx-http-flv-module
    • Nginx-WebDAV
  • Docker
    • CentOS7 安装 Docker
    • Dockerfile
    • DockerSwarm 集群
    • Docker 安装 guacamole
  • Python
    • 虚拟环境
  • Windows
    • Windows 问题集合
    • 迅雷自动安装 Chrome 插件
    • RDP 注册表
    • Rdp File Setting
    • 本地组策略对象(LGPO)工具
    • 禁用应用联网
    • SQL Server 问题处理
    • SQL Server Trigger
    • NSIS 脚本
    • 使用QEMU运行ARM64 CentOS7
    • DOS 脚本
    • Windows 11 设置旧版右键菜单
    • 远程桌面二次验证
  • Apple
    • AppStore 应用开发及上架
    • Apple 打包 Golang WebDav 制作 pkg 安装包
  • Android
    • Android Studio创建具有root权限的虚拟机
    • Android读写挂载system
    • Android安卓CA至系统
  • 证书
    • 证书名称(主题)
    • 证书扩展
    • SSL 自签
    • 免费 https 证书申请
  • 树莓派
    • 树莓派系统烧录及系统打包制作
    • 树莓派基础操作
    • 树莓派安装 NextCloud
    • 树莓派安装 LNMP
    • 树莓派自定义开机界面和登录提示
    • 树莓派安装 HomeAssistant
    • HomeAssistant 配置
    • 树莓派自动挂载 U 盘
    • 树莓派安装 vsftpd
    • vsftpd 配置文件详解
  • ceph
    • ceph-deploy 部署 ceph nautilus 版本
    • ceph dashboard
  • OpenStack
    • OpenStack VM 配置 Virtual IP
    • OpenStack Glance 对接 Ceph RBD 存储
    • OpenStack Cinder Volumes 对接 Ceph RBD 存储
    • OpenStack 集群搭建
    • OpenStack Rocky 单节点部署
    • OpenStack Rocky 集群部署
    • OpenStack CentOS6 镜像制作
    • OpenStack-Ubuntu 镜像制作
    • Openstack-Windows 镜像制作
    • OpenStack-RBD 导入镜像
    • OpenStack-Rocky 灾备
    • rbd-mirror
  • FFmpeg
    • CentOS7 静态编译FFmpeg
    • MacOS10.12静态编译FFmpeg
    • CentOS7 Arm64静态编译FFmpeg
    • 使用NVIDIA显卡
    • 脚本
  • Other
    • 华为一碰传标签制作
    • 常用软件
    • wireguard
由 GitBook 提供支持
在本页
  1. AI

qwen2.5 填充权重

填充权重

# https://github.com/QwenLM/Qwen2.5/issues/578
def padding_and_saving_weight(model: torch.nn.Module, output_dir: str):
    assert model.config.intermediate_size == 29568, "intermediate_size 不是 29568"
    
    pad_size = 128
    old_intermediate_size=29568
    new_intermediate_size=old_intermediate_size+pad_size

    exponent = math.log(pad_size, 2)
    assert exponent.is_integer(), f"{pad_size} 不是2的次方数"
    exponent = int(exponent)

    assert (old_intermediate_size/pad_size).is_integer(), f"{old_intermediate_size} 不能被 {pad_size} 整除"

    need_pad_values = [int(old_intermediate_size // (2 ** i)) for i in range(exponent + 1)]

    sd = model.state_dict()
    for i, k in enumerate(sd):
        v = sd[k]
        if len(v.shape) == 2 and ( ('mlp.up_proj.' in k) or ('mlp.gate_proj.' in k) or ('mlp.down_proj.' in k)):
            if v.shape[0] in need_pad_values :
                need_pad_size = v.shape[0]*new_intermediate_size/old_intermediate_size - v.shape[0]
                assert need_pad_size.is_integer() , f"{need_pad_size} 不是整数"
                need_pad_size = int(need_pad_size)
                
                prev_v = F.pad(v.unsqueeze(1), (0, 0, 0, 1, 0, 0)).reshape(v.shape[0]*2, -1)[:need_pad_size*2]
                new_v = torch.cat([prev_v, v[need_pad_size:]], dim=0)
                sd[k] = new_v
                print(k, i, v.shape, '-->', new_v.shape)
            elif   v.shape[1] in need_pad_values:
                need_pad_size = v.shape[1]*new_intermediate_size/old_intermediate_size - v.shape[1]
                assert need_pad_size.is_integer() , f"{need_pad_size} 不是整数"
                need_pad_size = int(need_pad_size)
                
                prev_v= F.pad(v.unsqueeze(2), (0, 1)).reshape(v.shape[0], v.shape[1]*2)[:, :need_pad_size*2]
                new_v = torch.cat([prev_v, v[:, need_pad_size:]], dim=1)
                sd[k] = new_v
                print(k, i, v.shape, '-->', new_v.shape)
                
    model.config.intermediate_size=new_intermediate_size
    model.save_pretrained(output_dir, state_dict=sd, max_shard_size="4GB", safe_serialization=True)
    
    
上一页Qwen2.5 VL AWQ量化下一页JavaScript

最后更新于22天前