Professional Data Engineerを受験したので結果と勉強方法をまとめました


はじめに

本記事はNI+C Advent Calendar 2021の10日目の記事となります。
弊社ではGCPの認定資格取得のための勉強会も行っており、3日目の記事である新人社員が Google Cloud 認定資格の Associate Cloud Engineerを合格するまでも弊社内の取り組みとなっております。

本記事はGCPのProfessional資格である「Professional Data Engineer」の勉強記および受験記となります。
なんとブログ執筆日の今日に試験を受けてきましたので現地レポート感ある感じで執筆しています。

そもそもどんな資格か

GCPの公式ページには以下の記載がされています。

Professional Data Engineer は、データを収集、変換、公開して、データに基づいて意思決定できるようにします。Data Engineer には、セキュリティとコンプライアンス、スケーラビリティと効率性、信頼性と忠実性、柔軟性とポータビリティに特に重点を置いて、データ処理システムの設計、構築、運用化、保護、モニタリングを行う能力が必要です。また、既存の機械学習モデルの活用、デプロイ、継続的なトレーニングもできなければなりません。

平たく言えば、Google Cloudが提供するマネージドサービスを利用し、ストレージシステムの構築やデータパイプライン設計、機械学習モデルの運用を行う知識があるかを確認する試験となります。
GCPの基本的な機能はもちろん、専門的な話も問題の中に出てきます。

受験者のスキルセットは

GCPの認定資格としてはProfessional Cloud ArchitectとAssociate Cloud Engineerを持っています。
Professional Data Engineerの問題で出てくるような業務経験はなく、SQLやデータパイプラインについても特段詳しいといったわけではないので、自分の中ではハードルが高い試験となっています。

どうやって勉強したか

主に以下の内容で勉強を行いました

  • 公式ページにある試験ガイド確認
  • 模擬試験によるテスト/ワード確認

公式ページにある試験ガイド確認

公式ページにある試験ガイドは、Professional Data Engineerに出てくる範囲が記載されています。こちらの内容が何かわからないとまずいので、ワードレベルでは確認を行いました。
本件の内容に関して調べた中で欲しい記事が見つからないことが多々あったため、別途投稿するかもしれないです。

模擬試験によるテスト/ワード確認

公式ページにある模擬試験より難易度が高い内容が実際の試験で出題される感触だったので、模擬試験は必ず確認したほうがいいです。
模擬試験を全部覚えるってことではなく、あくまでも模擬試験を受けた中でワードや解説が飲み込めない範囲を確認するといったことをメインに行いました。

試験問題の感触

試験問題はBigQueryと他ソリューションの組み合わせがメインでした。
試験ガイドのセクション1が5割近く出ていた印象です。サービス理解のみでは解けないと思いながら受けていました。ユースケースに沿った問題といったものはないので、ほとんど4択です(2つ選びましょうみたいな問題は3問程度)

また、セクション3の部分の機械学習系は数問出ていましたので、自信がある人はチャレンジするといいかもしれないです(自分は全くわからなくてひたすら首を捻っていました)

で、試験結果は?

試験結果としては、なんとか合格しました!
あまり自信がなく、ちょっとした記念受験感もあったので正直かなり驚きました。
資格試験に合格ができてよかったですが、自分の中でちゃんと理解できている部分とそうでない部分もあるため、引き続き勉強を継続していきたいです。