昨日、G検定を受講しました。
G検定対策は昨年と今年では結構変わっているようなので、これから受講する皆さんの為にお役に立てばと思い、情報を公開したいと思います。
経緯
私が勤務している会社はSIer(システムインテグレーター)なのですが、AIが流行っている昨今、G検定の技術者を増やすという会社方針が打ち出されました。
そこで、仕事で直接AIと関係が無い若手社員が次々とG検定に合格する中、「一応仕事でAI関連やってる私が持ってないのもなぁ・・・」と考え、ついにG検定を受験することになりました。
受講した感想
問題は全部で191問でしたが、とにかく難しかったという感想です。
G検定は見直したいと思う問題をマーキングする機能があるので、最初は1時間くらいで一通り回答し、残り1時間でマークした問題を見直して点を稼ごうと思っていました。
しかし、実際に蓋を開けると、知らないキーワードがたくさん登場したり、上辺だけの知識では回答できない問題が出てきて、1問1問結構時間を取られました。
結局、ちょっとググったら分かりそうな問題をググってしまったので、全ての問題に解答するのに110分を費やす結果になりました。
今思うと、それはそれで良かったと思います。
というのが、自身の無い問題があまりに多すぎて、チェックした問題が全体の4割くらいになりました。
ここまでチェックが多くなると、ググればすぐ回答できそうな問題がどこにあるのか分からなくなりますので、ググってすぐ分かりそうな問題は素直にググった方が良い気がします。
出題傾向
一応、問題はできるだけ記録するよう努めましたが、時間が次第になくなってきたことで、20問ほど記録し忘れてしまいました。
結果的に9割程度しか記録できませんでしたが、そのなかで傾向を集計してみました。
最近の傾向として、公式テキストと黒本の問題集からは3割程度しか出題されないという話をよく聞きますが、確かにその通りでした。
次に、ジャンル別の出題傾向を見てみましょう。
「その他」になっているところは、AIの歴史問題や従来の機械学習に関するもの、勾配降下や学習率、活性化関数などのディープラーニング全般知識、ディープフェイクやadversarial exsampleなどジャンル分けが難しいものになります。
ジャンル分けが難しい部分があるのですが、参考としてカウントした結果も載せておきます。
冒頭にも申しましたが、191問のうち20問は記録してなかったので出題数の合計が171になりますが、ご了承ください。
ジャンル | 出題数 |
---|---|
敵対性ネットワーク | 2 |
状態空間モデル | 3 |
転移学習 | 4 |
統計 | 5 |
RNN | 5 |
物体認識(セグメンテーション) | 5 |
XAI | 6 |
AIに関する世界動向 | 6 |
音声関連 | 6 |
強化学習 | 7 |
自然言語処理 | 9 |
CNN | 11 |
法律 | 14 |
その他 | 88 |
キーワード
今回のテストで登場したキーワードについて、主なものを記載しておきます。
キーワード |
---|
説明可能なAI(XAI) |
ImageNet |
カルマンフィルターが使われている技術例 |
キャプション生成 |
画像生成 |
ガウシアンフィルタ |
相間係数 |
ガウシアンフィルタ |
KIST |
adversarial exsample |
双方向リカレントニューラルネットワーク |
OpenAI |
空間状態モデル(ARIMA) |
ボルツマンマシン |
顔認証技術の世界動向 |
ランダムフォレスト |
単純パーセプトロン |
U-NET |
RNNにおける教師強制(teacher forcing) |
機械学習におけるデータ集合 |
統計量、期待値、確率変数、共分散 |
ポアソン回帰と線形回帰の違い |
データ拡張 |
マルチモーダル |
確率の期待値 |
NAS、Elmo、Rainbow、DCGAN |
NN構造の最適化 |
ディープフェイク |
単純埋め込みモデル |
EfficientNet |
自己回帰モデル |
自然言語処理 |
自動運転・道路改正関連 |
アンサンブル学習の効果 |
YOLO,FCN、U-NET、SSD |
ここ20年で大きく活用が進んだ技術 |
OCR |
ドロップアウトの仕組み |
注意機構(Attention Mechanism) |
GDPR |
BoW |
インセプションモジュール |
MNIST |
GPGPU |
セマンティックウェブ |
相間、変相間、共分散、分散 |
t-SNEのtの意味 |
行動価値関数 |
日本、欧州、豆里香などのAI倫理指針 |
データサイズ(PB EB YB ZB) |
情報量 |
トピックモデル |
セマンティックセグメンテーション |
MAML |
HOG |
バイアスとバリアンス |
AIブレイクスルーの理由 |
A3C |
ベイズ推定 |
FastR-CNNでのROIプーリング |
R-CNN |
Q学習 |
XG-Boost |
自然言語処理 |
define-by-runと defin-and-run |
強調フィルタリング |
グローバルアベレージプーリング(GAP) |
データリンケージ |
FCN |
actor-click |
RPA |
RNNとAR,ARIMA,ARMAの関係 |
まとめ
以上、2020年11月7日のG検定を受けた感想と出題傾向等の情報共有でした。
G検定は出題範囲がかなり広く、ディープラーニングに関してはかなりの量の専門用語(NAS、R-CNN、FCN、BoW、YOLO、U-NET、SSD・・・)について、その仕組みや、他との違いについて理解しておく必要があります。
但し、全てを完全に覚えておく必要はないので、ある程度概要を理解しておき、紙やEXCELにまとめてサクッと閲覧できるようにしておけば、何とかなります。
たぶん・・・
コメント