SinGAN
3333 ワード
Githubを参照
https://github.com/tamarott/SinGAN
注意!
このコードは、
torch 1.4.0
、torchvision 0.5.0
のバージョンを使用することができる.最新バージョンを使用する場合は、Githubを使用しますが、論文とまったく同じ結果は生成されません.そこで、これらのライブラリのバージョンを調整しました.学習環境
Train
%run main_train.py --input_name <input_file_name>
各scaleはiter回数を25単位で表示し、scaleごとに2000回反復する.scale値は単独で決定されず,大部分はscale 7,8で学習を終了した.(あと6日!)timeライブラリを用いて学習時間を測定した場合,最低20分(scale=6)から最大58分(scale=8)までの分布は,平均45~50分の学習時間を要する.
Paint2Image
%run paint2image.py --input_name <training_image_file_name> --ref_name <paint_image_file_name> --paint_start_scale <scale_to_inject>
paint start scale=1はランダムノイズから始まる結果であり、逆にソースから離れた状態を示し、概ねpaint start scale=2,3の場合はpaintimageの特徴を際立たせることができる.Example
まず,テストのために,2枚の図を論文に存在する例でテストした.
1.図1
data:image/s3,"s3://crabby-images/7810d/7810d5c131e7a89a5f9e500bd0c7784842dd29d4" alt=""
data:image/s3,"s3://crabby-images/d143a/d143aaa4e2e80eb1532f1b5d3e2642901eb3c5ab" alt=""
学習にはscale 6,約20余り(1286秒)を用いた.
2.図2
data:image/s3,"s3://crabby-images/fce41/fce41f973e5f363dc2cb5fa97213eca26bada660" alt=""
data:image/s3,"s3://crabby-images/27135/2713568dca28cd221f7ead6166905a8bd545bc7e" alt=""
学習にはscale 8、約48余量(2936秒)が必要である.
3.図3
data:image/s3,"s3://crabby-images/374a4/374a48e3f5421c9a0e8fb798039933a94efee0ee" alt=""
data:image/s3,"s3://crabby-images/9f594/9f59444eaf883720b54a2c40322cc77bb142c3ea" alt=""
学習にはscale 8、約48余量(2930秒)が必要です.
4-1. 図4-1
data:image/s3,"s3://crabby-images/28d9f/28d9faad6811fde52f97abeee27bf06a6ffd8dd3" alt=""
data:image/s3,"s3://crabby-images/2de4c/2de4cb3ab75add85e5b7d0eebb3efcf600370045" alt=""
4-2. 図4-2
data:image/s3,"s3://crabby-images/8f311/8f311f1feb648ea377feda5159e18da36945bf94" alt=""
data:image/s3,"s3://crabby-images/c3485/c3485e7b94f670ac4781b273253eadf663ea0e8e" alt=""
4-3. 図4-3
data:image/s3,"s3://crabby-images/54905/549051d5fa83009717941d287d7ba4674256229a" alt=""
data:image/s3,"s3://crabby-images/91bcc/91bcc01954f2f69f1cc49bc0ee8faad988b59977" alt=""
学習にはscale 8、約58余量(3519秒)が必要です.
総評
一般的に、学習にはscale 8が必要で、平均45~50分かかります.paint 2 imageの場合、paint start scale=1はランダムノイズからの結果であり、逆にソースから離れた状態を示し、概ねpaint start scale=2,3の場合、paint scale=2,3はpaint画像の特徴を際立たせることができる.
また、図4〜図4〜図4〜図2に示すように、原画像に用いられる色は、より良い結果を得ることができる.(SinGANを使用する場合は、Webプレゼンテーションでもこれらの要因を考慮すべきだと思います.)
そこで、予め設定された入力画像N章を学習し、各モデルを作成した後、ユーザから入力対入力画像の参照画像を入力する.この参照画像によりpaint start scale=2または3をパラメータとしてpaintto imageタスクを行うことができる.
Reference
この問題について(SinGAN), 我々は、より多くの情報をここで見つけました https://velog.io/@yoonj98/SinGAN-q8an99i9テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol