PyTorch学習ノート(五)----データ並列処理

29255 ワード

転載は作者と出典を明記してください。http://blog.csdn.net/john_bh/
記事の目次
  • .使用説明
  • .完全コード
  • 総括
  • 1.使用説明
    どのようにDataParalelを使ってマルチGPUを使うかを勉強します。複数のGPUをPyTorchで使うのはとても簡単です。モデルをGPUに置くことができます。
    device = torch.device("cuda:0")
    model.to(device)
    
    次に、全枚数をGPUにコピーする。
    mytensor = my_tensor.to(device)
    
    注意してください。myを呼ぶだけです。tenssor.to(device)は一つのmyに戻ります。tensiorの新しいコピーはGPUではなく、MY_を書き換えます。tensor彼に新しいテンソルを割り当ててGPUでこのテンソルを使う必要があります。
    多GPUでフィードフォワードを行うのは、フィードフォワード操作がとても自然です。それでもPyTorchはデフォルトでは一つのGPUしか使えません。Data Paralelを使ってモデルを並列に実行させることで、多GPU上であなたの操作を容易に実行することができます。
    model = nn.DataParallel(model)
    
    2.完全コード
    小さいデモを作って、モデルは入力を得るだけで、線形操作を行い、出力を与えます。
    # -*- coding:utf-8 -*-
    import torch
    import torch.nn as nn
    from torch.utils.data import Dataset, DataLoader
    #  
    input_size = 5
    output_size = 2
    
    batch_size = 30
    data_size = 100
    #  
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    
    #        (      getitem)
    class RandomDataset(Dataset):
        def __init__(self, size, length):
            self.len = length
            self.data = torch.randn(length, size)
    
        def __getitem__(self, index):
            return self.data[index]
    
        def __len__(self):
            return self.len
    
    rand_loader = DataLoader(dataset=RandomDataset(input_size, data_size),batch_size=batch_size, shuffle=True)
    
    #     
    class Model(nn.Module):
        def __init__(self, input_size, output_size):
            super(Model, self).__init__()
            self.fc = nn.Linear(input_size, output_size)
    
        def forward(self, input):
            output = self.fc(input)
            print("\tIn Model: input size", input.size(), "output size", output.size())
    
            return output
    
    #           ,          GPU。      GPU,     nn.DataParallel         。     model.to(device)        GPU  。
    model = Model(input_size, output_size)
    if torch.cuda.device_count() > 1:
      print("Let's use", torch.cuda.device_count(), "GPUs!")
      # dim = 0 [30, xxx] -> [10, ...], [10, ...], [10, ...] on 3 GPUs
      model = nn.DataParallel(model)
    
    model.to(device)
    
    #    :                    。
    for data in rand_loader:
        input = data.to(device)
        output = model(input)
        print("Outside: input size", input.size(),
              "output_size", output.size())
    
    
    GPUがない場合、またはGPUが一つしかない場合、30個の入力と30個の出力を取得すると、モデルは30個の入力と30個の出力を期待しています。
    Let's use 1 GPUs!
    In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
            In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
    Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
            In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
            In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
    Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
            In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
            In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
    Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
            In Model: input size torch.Size([5, 5]) output size torch.Size([5, 2])
            In Model: input size torch.Size([5, 5]) output size torch.Size([5, 2])
    Outside: input size torch.Size([10, 5]) output_size torch.Size([10, 2])
    
    GPUが2つあると、見られます。
    Let's use 2 GPUs!
        In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
        In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
    Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
        In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
        In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
    Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
        In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
        In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
    Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
        In Model: input size torch.Size([5, 5]) output size torch.Size([5, 2])
        In Model: input size torch.Size([5, 5]) output size torch.Size([5, 2])
    Outside: input size torch.Size([10, 5]) output_size torch.Size([10, 2])
    
    もし8つのGPUがあったら、あなたは見ます。
    Let's use 8 GPUs!
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
        In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
    Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
        In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
        In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
        In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
        In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
        In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
    Outside: input size torch.Size([10, 5]) output_size torch.Size([10, 2])
    
    締め括りをつける
    データは並列に自動的にデータを分割し、タスクシートを複数のGPUに送信します。各モデルが自分の任務を完了したら、DataPalelはこれらの結果を収集して統合して、またあなたに返します。