Columnコラム

「データサイエンティスト検定™」データサイエンティストの第一歩:DXコラム

更新日:2022年03月07日

今回は、我々ディジタルグロースアカデミアがご提供している『データサイエンティスト検定™ リテラシーレベル対策講座』に関連して、そもそも『データサイエンティスト検定™ リテラシーレベル』とはどのような試験なのか?についてお話をしていきます。

どのような試験なのか?

試験概要

『データサイエンティスト検定™ リテラシーレベル』とはどのような試験なのか、という点について、当検定の主催であるデータサイエンティスト協会によると、

『データサイエンティスト検定™ リテラシーレベル』(略称:DS検定™ ★)とは、アシスタント・データサイエンティスト(見習いレベル:★)と数理・データサイエンス教育強化拠点コンソーシアムが公開している数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラムを総合し、実務能力と知識を有することを証明する試験です。

と定義されています。

ここで注目したいのは、

  • アシスタント・データサイエンティスト(見習いレベル:★)
  • 数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラム
という2つの内容が試験範囲になっている、という点です。

この2つについてそれぞれ見ていきましょう。

試験範囲①

アシスタント・データサイエンティスト(見習いレベル:★)についてですが、データサイエンティスト協会によるとデータサイエンティストのスキルは4つのレベルに分かれると定義されています。

スキルレベルは★から★★★★で、以下のように定義されています。

スキルレベルスキルレベル目安
シニアデータサイエンティスト★★★★業界を代表するレベル
フルデータサイエンティスト★★★棟梁レベル
アソシエートデータサイエンティスト★★独り立ちレベル
アシスタントデータサイエンティスト見習いレベル

今回の検定試験では、この1番下のレベルであるアシスタントデータサイエンティストとしての知識スキルを身に着けることをゴールとしています。

またこのデータサイエンティストのスキルについては、500以上のスキルが定義されており、ビジネス力、データサイエンス力、データエンジニアリング力の3つのカテゴリで整理されています。

その中で、アシスタントデータサイエンティストレベル(★1レベル)のスキル項目として200弱のスキルが定義されています。

参考:2021年度版「データサイエンティスト スキルチェックリストver.4」のリリース

つまり、検定試験に臨むうえでは、アシスタントデータサイエンティストレベル(★1レベル)のスキルである200弱のスキル項目について学習する必要があります。

試験範囲②

2つ目の試験範囲が数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラムです。

こちらは、2020年4月に数理・データサイエンス教育強化拠点コンソーシアムが公開した大学生・高専生を対象にした学習のためのモデルとなるカリキュラムのことです。

別の言い方をすると、大学生、高専生が授業で学習するための教材の元となるお手本カリキュラムということです。

このモデルカリキュラムは、導入・基礎・心得、選択の4段階に分かれていて、そのうちの導入・基礎・心得までの3つの学習項目が本検定試験の出題範囲となっています。

データサイエンティスト協会とは別の団体が整理した内容のため、前述のスキルチェック項目とも一部重複がありますが、モデルカリキュラム独自の内容もあります。

そのため、試験対策のためには、試験範囲①の200弱のスキル項目だけでなく、こちらのモデルカリキュラムについても学習する必要があります。

試験においては約20問(25%程度)はこちらのモデルカリキュラムから主題される予定です。

参考:モデルカリキュラム (リテラシーレベル)

試験の出題スタイル

この検定試験は、全国の試験会場で開催される、CBT方式を採用しています。

問題数80問程度で、試験時間90分の選択式問題形式で出題されます。

また、試験問題は、実際のビジネスシーンを想定したような問題が多く出される傾向があります。例えば、コンビニエンスストアからとある表1にあるようなデータを預かったときに、

ダミー変数に変換するデータはどれか?という問題に対して、

  • 最寄駅からの距離
  • 売上金額
  • 店舗面積
  • すべて変換対象である
という4択から正解を選ぶという形式です。

この問題はデータサイエンティスト協会のHPに公開されている模擬問題からの抜粋です。

是非実際に以下のURLから実際の問題にアクセスしてチャレンジしてみてください。

参考:2021年度データサイエンティスト検定模擬問題

難易度

データサイエンティスト検定の難易度は、かなり高いといえます。

例えば、第1回(2021年9月)では、約1,400名が受験し、合格者が927人ですから、合格率は「約66%」です。

また、第2回(2022年6月)の場合は受験者数が2,900名に対し、合格者数が1,453名ですから「約50%」まで低下しています。

決して低くはない数値ですが、受験数が増加したのに対して合格率が伸び悩んでいる背景を鑑みると、その難易度が高いことは容易に想像できるでしょう。

合格ライン

データサイエンティスト検定の合格ラインは、正答率約80%という基準のため、低くはない合格率であっても一定の知識や技術を身に付けなければ厳しいでしょう。

ただ、試験問題は各試験回によって少しずつ刷新される方式ですから、正答率もそれに応じて変更される可能性はあります。

また、合否判定では不正行為の発覚といった例外的な判定措置を取る場合もあるため、合格ラインを安定的に目指せるよう学習しておくことをおすすめします。

参考:データサイエンティスト検定 リテラシーレベル | 一般社団法人 データサイエンティスト協会

どのように対策をすべきか?

試験範囲であるスキルチェック項目もモデルカリキュラムもインターネット上で公開されています。しかし、スキルチェック項目もモデルカリキュラムも公開されている情報は要点のみを記載したものとなっていて、これだけ学習することは困難です。

そのため、試験対策としては、データサイエンティスト協会によって、参考書籍として、紹介されている『最短突破データサイエンティスト検定(リテラシーレベル)公式リファレンスブック』に掲載されている試験範囲の内容の解説を熟読するのがまずはよいかと思います。こちらの参考書籍の中には、模擬問題も数十問は掲載されているので、簡単な腕試しをすることもできます。

(第一回として2021年9月に行われた検定試験に無事合格した当コラムの筆者もこの参考書籍は何度も読み返しました。)

参考:最短突破データサイエンティスト検定(リテラシーレベル)公式リファレンスブック

また、弊社もこの本で解説される内容についてさらに要点を整理し、動画で解説したeラーニングを提供しておりますので、是非そちらも併せてご検討いただけると幸いです。

参考:データサイエンティスト検定™リテラシーレベル対策講座

データサイエンティストに必要な知識・スキル

データサイエンティストに求められる代表的な知識・スキルは、以下の通りです。

  • データ分析を行う上で重要な「統計学」
  • 膨大なデータを取り扱うために必要な「情報工学」
  • 事業に貢献するために必要な「ビジネススキル」

データ分析を行う上で重要な「統計学」

データサイエンティストに必要となる知識・スキルが、「統計学」です。

統計学では、高校卒業程度の数学を身に付けている必要があり、確率・統計・微分積分・行列の知識も必要です。

また、より深く分析する際には、大学の領域である解析学や線形代数学まで覚えていると良いでしょう。

データサイエンティストが取り扱うビッグデータは、全体または一部の性質を適切に見極める必要があるため、統計学は必要不可欠です。

膨大なデータを取り扱うために必要な「情報工学」

また、データサイエンティストは取り扱うデータが膨大ですから、情報工学の知識・スキルが求められます。

プログラミングや数学といった情報処理に関する分野を担うため、高速処理や加工・解析に必要なアルゴリズムの構築にも携わります。

また、膨大なデータは生み出すだけに限らず、それを格納するために用いられるデータベースへの知識も必要でしょう。

事業に貢献するために必要な「ビジネススキル」

そして、データサイエンティストには、事業へ貢献するためのビジネススキルまで必要です。

なぜなら、そのデータをどのように活用できるのか、具体的にどの課題を解決できるのかなどを適切に判断し、相手に伝える必要があるからです。

また、データ分析で得られた情報を論理的思考で理解する必要もありますので、仮説と検証を繰り返すためにも「MECE・ロジックツリーなど」のアプローチを検討しましょう。

レポートやドキュメンテーションに分析をまとめて、その価値を引き出せる状態に整えるためのマネジメントもビジネススキルの一環です。

データサイエンティストにおすすめな他の資格

データサイエンティストにおすすめな他の資格は、以下の通りです。

  • 統計検定
  • データスペシャリスト試験
  • オラクルマスター
  • 基本情報処理技術者試験・応用情報技術者試験
  • G試験・E資格

統計検定

統計学検定とは、主に統計学に関連したスキル・知識を保有することを証明する認定試験のことです。

JSSC(Japan Statistical Society Certificate)によって提供され、準4級から準1級までの4段階に分かれています。

統計学で扱うデータのおおよそのゴールを、分析前からある程度まで正確に導き出す必要があることから、求められる知識やスキルは相当なものになります。

統計検定は、数字が低いものほど高レベルであることを証明できるため、データサイエンティストを目指す場合は視野に入れたい資格です。

データスペシャリスト試験

データスペシャリスト検定とは、IPA(情報処理推進機構)が提供する、データベース設計や運用・管理に関する認定資格です。

細かい製品に関する知識まで求められるため、難易度は高いものの、取得できれば専門家として技術支援を行えるレベルであることを証明できます。

また、データベースに限らず、情報分析からプロジェクト管理まで学べる資格のため、データサイエンティストとしては取得しておきたい資格です。

オラクルマスター

オラクルマスターは、データベースの構築・管理スキル・技術を保有していることを証明する資格です。

SQLのデータ抽出にまで対応する、世界共通試験のため、試験に合格できれば世界レベルであることを証明できるのもポイントです。

ただ、試験は以下の4種類あるため、目指す場合は最上位である「Platinum」が良いでしょう。

  • Bronze
  • Silver
  • Gold
  • Platinum

基本情報処理技術者試験・応用情報技術者試験

基本情報処理技術者試験・応用情報技術者試験は、IPA(情報処理推進機構)が提供する国家資格です。

情報処理の基本とプロジェクトマネジメントを学べ、データサイエンティストが正しくデータを管理するために必要な知識・技術が身に付きます。

また、データベースの構築に深く関わる内容が豊富なため、取得しておくとデータ管理を正しく行う方法から作業の進め方まで学べるのが利点です。

G試験・E資格

G試験・E資格とは、日本ディープラーニング協会(JDLA)が認定する試験・資格のことです。

G試験(検定)は、ジェネラリストと呼ばれるディープラーニングの知識を保有し、事業活用できる人材を認定する資格です。

E資格は、ディープラーニングを実装する人材のため、主にエンジニアを対象にしています。

ディープラーニングは機械学習の一つのため、主にAIへ携わるデータサイエンティストに向いているでしょう。

まとめ : DX推進に必要なデータサイエンティストを育成しよう

データサイエンティストは、DXの推進に必要不可欠な人材です。

ただ、以下のスキルが求められ、人材は不足しつつあるため、社内研修や資格の取得によって育成するといった方法まで考えましょう。

  • データ分析を行う上で重要な「統計学」
  • 膨大なデータを取り扱うために必要な「情報工学」
  • 事業に貢献するために必要な「ビジネススキル」

ディジタルグロースアカデミアでは、社内にデジタル活用を浸透させる基本的なプログラムから、求める技術に合わせた内容の研修まで幅広く提供しています。

事業のDXを推進する際に、DX人材の育成が必要でしたらぜひお気軽にお問い合わせください。

資料・研修動画ダウンロード申し込みページ

DXに関する様々な資料や動画がダウンロード可能です。

資料DL申し込みはこちら

Downloads資料DL申し込みはこちら

DXに関する様々な資料や動画がダウンロード可能です。

Contactお問い合わせはこちら

デジタル人材育成にお悩みの方は、ぜひ一度無料でご相談ください。
まずはお気軽にどうぞ。