CPU设备意味着所有物理CPU和内存, 这意味着PyTorch的计算将尝试使用所有CPU核心。可以用以下方式表示:
torch.device('cpu')GPU设备只代表一个GPU和相应的显存。
torch.device('cuda')如果有多个GPU,我们使用以下方式表示第 i i i块GPU(从0开始)
torch.device(f'cuda:{i}')另外,cuda:0和cuda是等价的,都是指第1块显卡。
深度学习框架要求计算的所有输入数据都在同一设备上,无论是CPU还是GPU。
不经意地移动数据可能会显著降低性能,框架通常会使用自己的线程来执行GPU计算,如果我们需要频繁地切换到Python的主线程,那么这就可能会触发全局解释器锁(GIL),导致GPU的计算被阻塞。
2. 查询和使用 查询可用GPU的数量torch.cuda.device_count() 处理不存在GPU的情况torch.device('cuda' if torch.cuda.is_available() else 'cpu') 查询GPU列表devices = [torch.device(f'cuda:{i}') for i in range(torch.cuda.device_count())]devices = if devices else [torch.device('cpu')] 查询张量所在的设备。 默认情况下,张量是在CPU上创建的。x = torch.tensor([1, 2, 3])x.device 创建张量时指定存储设备x = torch.tensor([1, 2, 3], device=torch.device('cuda'))x.device 数据复制到其他设备 CPU到GPU x = torch.tensor([1, 2, 3])x.cuda()# x.to(torch.device('cuda')) GPU到CPU x = torch.tensor([1, 2, 3], device=torch.device('cuda'))x.cpu()# x.to(torch.device('cpu')) 多GPU的情况:指定要复制到的GPU的序号 x = torch.tensor([1, 2, 3])x.cuda(i)# x.to(torch.device(f'cuda:{i}')) 模型复制到其他设备:与数据复制到其他设备的方法相同。net = nn.Linear(2, 1)net.cuda()# net.to(torch.device('cuda'))