张量交换维度的方法transpose()

transpose() 的核心思想是在指定的两个维度上交换张量的轴。为了理解其工作原理，我们可以分为以下步骤：

为了更清晰地理解，让我们深入研究“步幅”的概念。在 PyTorch 中，张量的存储通常是一维的。多维张量通过形状（大小的每个维度）和步幅来表示。步幅表示为从当前维度移动到下一维度时要跳过的数据数量。

考虑一个简单的2×3的张量：

1 2 3
4 5 6

在内存中，它可能被存储为 [1, 2, 3, 4, 5, 6]。原始步幅可能是 (3, 1)，表示移动到下一行需要跳过3个元素，而移动到下一列只需跳过1个元素。

当我们对此张量执行 transpose(0, 1) 时，我们只是交换了步幅，新的步幅变为 (1, 3)。这意味着现在，移动到下一行只需跳过1个元素，而移动到下一列则需跳过3个元素。结果张量的视图为：

1 4
2 5
3 6

请注意，我们并没有实际改变内存中的数据布局。通过交换步幅，我们得到了一个新的视图，它与原始张量共享相同的数据。

这种方法的优势在于其效率：我们不需要复制或重新排列任何数据，只需要更改形状和步幅信息。这也意味着原始张量和转置后的张量共享相同的内存，因此修改其中一个张量的值会影响另一个张量。