当前位置: 代码网 > it编程>前端脚本>Python > NumPy中数组的拼接(Concatenation)的使用

NumPy中数组的拼接(Concatenation)的使用

2026年04月17日 Python 我要评论
一、数组拼接的核心定义数组拼接是指将多个形状兼容的数组,沿着指定的轴(axis) 合并为一个新数组:轴(axis):拼接的方向,二维数组中 axis=0 表示按行拼接(垂直方向),axis=1 表示按

一、数组拼接的核心定义

数组拼接是指将多个形状兼容的数组,沿着指定的轴(axis) 合并为一个新数组:

  • 轴(axis):拼接的方向,二维数组中 axis=0 表示按行拼接(垂直方向),axis=1 表示按列拼接(水平方向);
  • 形状兼容:除拼接轴外,其他维度的大小必须完全一致(比如按行拼接时,所有数组的列数必须相同);
  • 核心函数:np.concatenate()(通用拼接)、np.vstack()(垂直拼接)、np.hstack()(水平拼接)、np.dstack()(深度拼接)。

二、核心拼接函数(分类讲解)

numpy 提供了多个拼接函数,其中 np.concatenate() 是最通用的底层函数,其他 vstack/hstack 是其简化版(无需指定轴)。

1. 通用拼接:np.concatenate ()(核心)

语法:

np.concatenate((arr1, arr2, ...), axis=0, out=none) 
  • (arr1, arr2, ...):待拼接的数组元组(必须用元组 / 列表包裹,不能直接传多个数组);
  • axis:拼接轴(默认 0),一维数组只能用 axis=0
  • out:可选,指定输出数组(一般不用);
  • 返回值:新数组(拼接后的结果,独立内存,不共享原数组数据)。

示例 1:一维数组合并(最基础)

import numpy as np
# 两个一维数组(模拟两个班级的学生分数)
class1 = np.array([85, 92, 78, 90])
class2 = np.array([88, 76, 95, 81])
# 拼接为一个一维数组(axis=0,唯一可选)
all_scores = np.concatenate((class1, class2))
print("拼接后一维数组:", all_scores)  # [85 92 78 90 88 76 95 81]
print("拼接后形状:", all_scores.shape)  # (8,)

示例 2:二维数组按行拼接(axis=0)

按行拼接要求所有数组的列数相同(垂直方向堆叠):

import numpy as np
# 两个二维数组(列数均为3)
arr1 = np.array([[1, 2, 3], [4, 5, 6]])  # 2行3列
arr2 = np.array([[7, 8, 9], [10, 11, 12]])  # 2行3列
# 按行拼接(axis=0)→ 4行3列
arr_v = np.concatenate((arr1, arr2), axis=0)
print("按行拼接结果:\n", arr_v)
print("拼接后形状:", arr_v.shape)  # (4, 3)

输出

按行拼接结果:
 [[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
拼接后形状: (4, 3)

示例 3:二维数组按列拼接(axis=1)

按列拼接要求所有数组的行数相同(水平方向拼接):

import numpy as np
# 两个二维数组(行数均为2)
arr1 = np.array([[1, 2], [3, 4]])  # 2行2列
arr2 = np.array([[5, 6], [7, 8]])  # 2行2列
arr3 = np.array([[9], [10]])       # 2行1列
# 按列拼接(axis=1)→ 2行5列(2+2+1)
arr_h = np.concatenate((arr1, arr2, arr3), axis=1)
print("按列拼接结果:\n", arr_h)
print("拼接后形状:", arr_h.shape)  # (2, 5)

输出

按列拼接结果:
 [[ 1  2  5  6  9]
 [ 3  4  7  8 10]]
拼接后形状: (2, 5)

2. 简化拼接函数(更直观)

为了避免记错 axis 参数,numpy 提供了更贴合语义的简化函数:

函数作用等价于适用场景
np.vstack()垂直拼接(按行)np.concatenate(..., axis=0)一维 / 二维数组按行堆叠
np.hstack()水平拼接(按列)np.concatenate(..., axis=1)一维 / 二维数组按列拼接
np.dstack()深度拼接(按第三个维度)np.concatenate(..., axis=2)三维数组拼接

示例:vstack/hstack 简化操作

import numpy as np
# 二维数组
arr1 = np.array([[1,2],[3,4]])
arr2 = np.array([[5,6],[7,8]])
# 垂直拼接(等价于 axis=0)
arr_v = np.vstack((arr1, arr2))
print("vstack结果:\n", arr_v)  # 4行2列
# 水平拼接(等价于 axis=1)
arr_h = np.hstack((arr1, arr2))
print("hstack结果:\n", arr_h)  # 2行4列

示例:一维数组的 hstack/vstack 特殊处理

一维数组用 hstack/vstack 会自动调整维度:

import numpy as np
a = np.array([1,2,3])  # 形状(3,)
b = np.array([4,5,6])  # 形状(3,)
# vstack:一维数组合并为二维(按行)→ (2,3)
v_arr = np.vstack((a, b))
print("vstack一维数组:\n", v_arr)
print("形状:", v_arr.shape)  # (2,3)
# hstack:一维数组合并为更长的一维 → (6,)
h_arr = np.hstack((a, b))
print("hstack一维数组:", h_arr)
print("形状:", h_arr.shape)  # (6,)

3. 深度拼接:np.dstack ()(三维数组)

按第三个维度(深度)拼接,适用于图像、三维数据:

import numpy as np
# 两个二维数组(形状均为(2,3))
arr1 = np.array([[1,2,3],[4,5,6]])
arr2 = np.array([[7,8,9],[10,11,12]])
# 深度拼接 → 形状(2,3,2)
d_arr = np.dstack((arr1, arr2))
print("dstack结果形状:", d_arr.shape)  # (2,3,2)
print("dstack结果[0,0,:]:", d_arr[0,0,:])  # [1,7](深度维度的两个值)

三、高维数组拼接(进阶)

高维数组拼接的核心是明确拼接轴的编号,维度编号从 0 开始:

  • 三维数组形状 (a,b,c) → 轴 0=a、轴 1=b、轴 2=c;
  • 拼接时,除拼接轴外,其他维度大小必须一致。

示例:三维数组拼接

import numpy as np
# 两个三维数组:形状(2,3,4)(轴0=2,轴1=3,轴2=4)
arr1 = np.arange(24).reshape(2,3,4)
arr2 = np.arange(24,48).reshape(2,3,4)
# 按轴0拼接 → 形状(4,3,4)
concat0 = np.concatenate((arr1, arr2), axis=0)
print("按轴0拼接形状:", concat0.shape)  # (4,3,4)
# 按轴1拼接 → 形状(2,6,4)
concat1 = np.concatenate((arr1, arr2), axis=1)
print("按轴1拼接形状:", concat1.shape)  # (2,6,4)
# 按轴2拼接 → 形状(2,3,8)
concat2 = np.concatenate((arr1, arr2), axis=2)
print("按轴2拼接形状:", concat2.shape)  # (2,3,8)

四、拼接的兼容性规则(核心避坑!)

拼接失败的唯一原因是形状不兼容,需牢记:

除拼接轴外,其他所有维度的大小必须完全一致。

示例:不兼容的拼接(报错)

import numpy as np
# 错误1:按行拼接(axis=0)但列数不同
arr1 = np.array([[1,2],[3,4]])  # 2行2列
arr2 = np.array([[5,6,7],[8,9,10]])  # 2行3列
try:
    np.concatenate((arr1, arr2), axis=0)
except valueerror as e:
    print("报错1:", e)  # all the input array dimensions except for the concatenation axis must match exactly
# 错误2:按列拼接(axis=1)但行数不同
arr3 = np.array([[1,2],[3,4]])  # 2行2列
arr4 = np.array([[5,6]])        # 1行2列
try:
    np.concatenate((arr3, arr4), axis=1)
except valueerror as e:
    print("报错2:", e)

解决方法:调整数组形状(reshape/expand_dims)

通过 reshapenp.expand_dims 让数组形状兼容:

import numpy as np
# 原数组:arr4是(1,2),行数为1(arr3行数为2,不兼容)
arr3 = np.array([[1,2],[3,4]])
arr4 = np.array([[5,6]])
# 方法1:给arr4添加一行(补0)
arr4_exp = np.vstack((arr4, [[0,0]]))  # 变为2行2列
concat_ok = np.concatenate((arr3, arr4_exp), axis=1)
print("调整后拼接结果:\n", concat_ok)
# 方法2:扩展维度(一维→二维)
a = np.array([1,2,3])  # (3,)
b = np.array([[4,5,6]]) # (1,3)
# 先将a转为(1,3),再按行拼接
a_2d = np.expand_dims(a, axis=0)  # (1,3)
concat_a_b = np.concatenate((a_2d, b), axis=0)
print("一维转二维后拼接:\n", concat_a_b)

五、常见应用场景

场景 1:合并多组数据(机器学习数据集)

import numpy as np
# 模拟3组特征数据(每组10个样本×5个特征)
feat1 = np.random.rand(10,5)
feat2 = np.random.rand(10,5)
feat3 = np.random.rand(10,5)
# 合并为30个样本的数据集(按行拼接)
all_feat = np.concatenate((feat1, feat2, feat3), axis=0)
print("合并后数据集形状:", all_feat.shape)  # (30,5)
# 合并特征列(比如添加新特征)
new_feat = np.random.rand(30,1)  # 30个样本×1个新特征
all_feat_new = np.hstack((all_feat, new_feat))
print("添加新特征后形状:", all_feat_new.shape)  # (30,6)

场景 2:合并时间序列数据(温度数据)

import numpy as np
# 模拟3月和4月的温度数据(各31天×24小时)
march_temp = np.random.normal(5,6,(31,24)).round(1)
april_temp = np.random.normal(15,5,(30,24)).round(1)
# 合并为2个月的温度数据(按行拼接,行数31+30=61)
spring_temp = np.vstack((march_temp, april_temp))
print("春季温度数据形状:", spring_temp.shape)  # (61,24)

场景 3:批量拼接多个数组

import numpy as np
# 生成10个一维数组,每个数组5个元素
arr_list = [np.random.randint(0,10,5) for _ in range(10)]
# 拼接为一个一维数组
all_arr = np.concatenate(arr_list, axis=0)
print("批量拼接后形状:", all_arr.shape)  # (50,)

六、避坑点与最佳实践

1. 核心避坑点

  • ❌ 误区:直接传多个数组给 concatenate(必须用元组 / 列表包裹,如 (arr1,arr2));
  • ❌ 错误:一维数组用 axis=1 拼接(一维数组只有 axis=0,会报错);
  • ❌ 忽略:拼接轴的方向(二维数组 axis=0 是行,axis=1 是列,易记反);
  • ❌ 混淆:vstack 对一维数组的处理(会转为二维,而 concatenate 保持一维)。

2. 最佳实践

  • ✅ 简单拼接用 vstack/hstack(语义清晰,无需记 axis);
  • ✅ 高维数组用 np.concatenate(明确指定 axis);
  • ✅ 拼接前检查形状:用 arr.shape 确认除拼接轴外其他维度一致;
  • ✅ 批量拼接多个数组时,先放入列表,再传给 concatenate;
  • ✅ 需频繁拼接时,先预分配数组(np.empty)再填充,比多次拼接更高效。

总结

  1. numpy 数组拼接的核心是 np.concatenate(),vstack/hstack 是简化版(分别对应 axis=0/1);
  2. 拼接规则:除拼接轴外,其他维度大小必须完全一致,否则报错;
  3. 维度说明:
    • 一维数组:仅能按 axis=0 拼接(hstack 合并为更长一维,vstack 转为二维);
    • 二维数组:axis=0 按行拼接(列数一致),axis=1 按列拼接(行数一致);
  4. 避坑关键:拼接前检查形状兼容性,一维数组需转二维时用 np.expand_dims;
  5. 常用场景:合并数据集、添加特征列、合并时间序列数据。

到此这篇关于numpy中数组的拼接(concatenation)的使用的文章就介绍到这了,更多相关numpy 数组拼接内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2026  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com