ElixirでIoT#1.3.3:logistic_mapをIoTボードで性能評価してみた


この記事は「fukuoka.ex x ザキ研 Advent Calendar 2017」の19日目です.

昨日は @zacky1972 さんの「ZEAM開発ログ v.0.3.0 Elixir から GPU を駆動するベンチマークをいろいろアップグレードしてみた」 でした.

はじめに

どうもこんにちは.
fukuoka.exという技術コミュティにて,ElixirをIoTボードで動かしたらどうなんの?というIoT芸を披露しております.

これまでの連載記事では,IoTボード上でElixirが実行できる環境を構築し,それぞれの性能をベンチマークアプリで評価してきました.
 |> ElixirでIoT#1.0:IoTボードへのLinux環境の準備
 |> ElixirでIoT#1.1:IoTボードへのElixir環境の構築とEEloTツールキットの紹介
 |> ElixirでIoT#1.2:いろいろ分かるベンチマークを整備してみる
 |> ElixirでIoT#1.3:IoTボードで動いた!Phoenixが立った!性能評価と考察
  |> ElixirでIoT#1.3.1:ベンチマークのパラメータを振って性能評価してみた
  |> ElixirでIoT#1.3.2:プロセッサコアの動作周波数を揃えて比較評価してみた

これまでの性能評価を,下記のようにまとめました.

  • IoTボードでもElixirは動く!Phoenixだって立つ!!
  • Elixir並列処理はすごい!マイクロアーキよりコア数!!
    • IoTボードでも高性能なものをドンと置くよりもコアをズラッと並べるほうが有利!
    • XU3/A15は最大2.0GHzなのも効いている?
  • サーバ性能はネットワーク接続方法も大事なのかも?
    • Ethernet接続で対決させたら違う傾向になるかも
  • ZYBOは健闘はしたものの,,,FPGA活用に期待しましょう
  • なお消費電力は??
    • ZYBO << XU3 < RPi3 <<<(超えられない壁)<<< Mac
  • EEloTを使えば性能の比較評価もお手のもの
  • EEloTベンチマークアプリのパラメータを振って性能評価してみました
    • パラメータにうまく比例した性能を発揮!
    • コア数についての並列性能もお見事!でもSoCアーキには要注意!?
  • IoTボードのコアの動作周波数を揃えて性能評価してみました
    • 当たり前ではあるけど,とにかく速い周波数で動かしたほうが有利です
    • 命令セットの違いもElixirの性能に大きな影響を及ぼします
    • 周波数が同じでもコア数が多いほうがやっぱり並列性能を発揮できます

今回は,本Advent Calendarの主催元であるZACKY先生が整備されたロジスティック写像のベンチマークアプリを使って,IoTボードの性能評価をしてみたいと思います.
ちなみに今回がElixirでIoT#1シリーズの最終回です!!

ロジスティック写像とは?

ZACKY先生の過去記事にも紹介がありますが,ロジスティック写像とは生物の個体数の時系列に対する変遷のモデルです.単純な式でありながら解が複雑な振る舞いをすることが知られています.
整数演算として次の漸化式で表現できます.

$X_{i+1} = \mu_{p} X_{i}(X_{i+1}) \mod p $

今回は下記のGitHubリポジトリにあるソースを利用しました.

Elixirの動作するErlang VMには,他言語で実装されたモジュールを呼び出すことができるNIF(Native Implemented Functions)という機能が提供されています.logistic_mapではRustのモジュールを呼び出すライブラリであるRustlerが使われおり,NIF機能の有効性を評価することができます.
Rustlerの使用の有無での評価を見てみたいので,benchmarks3: pure Elixir(inlining inside of Flow.map)benchmarks8: Rustler loop, passing by list, with Windowを使いました.また,Flowによる並列プログラミングで記述されており,並列化の段数も指定しました.

Rust環境の用意

Rustが実行できる環境をIoTボードで用意しました.
とはいえ汎用PCでの方法と変わりはありません.

$ curl https://sh.rustup.rs -sSf | sh
$ source $HOME/.cargo/env

評価結果

@logistic_map_size は0x500000としました.各IoTボードのスペックは連載記事#1.0の表をご参照ください.

単位は秒で,行見出しの数値はFlowにおける並列数です.

RP3B/Raspbian RP3B/Ubuntu ODROID-XU3 ZYBO Macbook Pro
benchmarks3 1 46.989 49.799 23.884 87.184 3.955
2 23.486 25.134 12.726 47.905 2.561
4 14.020 14.821 8.895 47.942 2.141
8 14.370 15.200 6.865 48.387 2.448
16 13.802 14.606 6.629 48.319 2.290
benchmarks8 1 24.318 24.065 13.769 50.701 1.574
2 21.584 21.550 9.922 40.436 1.972
4 13.745 14.613 7.619 38.454 1.880
8 14.550 14.948 6.920 39.290 2.066
16 15.481 15.696 7.854 39.637 2.068

これらの結果からは,NIFを介した他モジュールの呼び出しは,IoTボードでも性能向上に寄与できることが分かります.
特にFlowにおける並列数の指定が小さい場合には,Rustlerによる性能向上が大きくなりました.

ただし,並列数が大きくなるとRustlerによる性能向上はあまり見られません.
これは,NIFを介して実行されるRustモジュールは,Erlang VMによる並列性能の恩恵を受けられないためであることが考えられます.
さてこの辺りはどうなんでしょう,,,というところは,fukuoka.ex勢でワルダクミしてたりします.これからの展開にご期待くださいませ!!

まとめ

  • ZACKY先生の実装されたlogistic_mapアプリを,IoTボードにて性能評価してみました
    • 並列数が小さい場合には,IoTボードでもNIFを介したRustモジュールによる性能向上の恩恵が受けられます
    • NIFモジュールはErlang VMによる並列性能を発揮できないため,並列数が大きい場合にはそれほどの恩恵は出ません

よろしければ「いいね!」いただけるととっても嬉しいです.
「ElixirでIoT芸」に需要あるのか露頭に迷っている書き手の励みになります

明日の「fukuoka.ex x ザキ研 Advent Calendar 2017」の記事は, @kobatako さんの
GraphQL for Elixir#3 Middlewareと認証について考える
です.お楽しみに!

お知らせ!

「ElixirでIoT」シリーズの性能評価篇が学術論文として発表されました!

「関数型言語ElixirのIoTシステムへの導入に向けた基礎評価」
 |> 情報処理学会研究報告(組込みシステム),
 |> Vol. 2018-EMB-48,No. 5,pp. 1--8,2018年6月.

@twinbee さんと @zacky1972 先生との共著です!
学会会員でないと有料ではありますが,,,情報処理学会電子図書館のこちらからダウンロードできます.発表資料はSlideShareにて公開していますので,ご興味ありましたらぜひご覧ください^^;