kaeken(嘉永島健司)Techブログ

主に情報科学/情報技術全般に関する知見をポストします。(最近は、特にData Science、機械学習、深層学習、統計学、Python、数学、ビッグデータ)

データサイエンティスト(DS)になるためのスキルチェックシート

一般社団法人データサイエンティスト協会 という団体からデータサイエンティスト(以下DS)になるための目安となる スキルチェックシートが提供されている。

DSスキルチェック | Data Scientist Society Journal DSスキルチェック | Data Scientist Society Journal

概要を抜粋

活用シーン

データサイエンティストのスキルレベルを把握したいときに 就職や転職時に求められているスキルを把握したいときに 大学や職場での学習・教育内容を決めるときに

機能

スマートフォンを使って、いつでもどこでもスキルチェックを行うことができます データサイエンス力(サイエンス)・データエンジニアリング(エンジニア)・ビジネス力(ビジネス)の3領域を棟梁レベル・独り立ちレベル・見習いレベルの3レベルごとに回答できます 全国平均などから、他者との相対的なスキルレベルが確認できる結果やデータサイエンティスト協会のフォーマット(Excel形式)でダウンロードできます 過去のチェック結果を保存。いつでもオンライン上で見直すことができます

以下にPDF版がある。

http://www.datascientist.or.jp/common/docs/skillcheck.pdf

カテゴリだけ抜粋

データサイエンス力
(項目数:180)
1   統計数理基礎
2   予測
3   検定/判断
4   グルーピング
5   性質・関係性の把握
6   サンプリング
7   データ加工
8   Data visualization
9   機械学習
10  時系列分析
11  言語処理
12  画像処理
13  音声処理
14  パターン発見
16  グラフィカルモデル
17  統計数理応用
18  シミュレーション/データ同化
19  最適化


データエンジニアリング力
(項目数:119)
1   環境構築
2   データ収集
3   データ構造
4   データ蓄積
5   データ加工
6   データ共有
7   プログラミング
8   ITセキュリティ

ビジネス力
(項目数:123)
1   行動規範
2   論理的思考
3   プロセス
4   データの理解・検証
5   データ入手
6   意味合いの抽出、洞察
7   解決
8   事業に実装する
9   活動マネジメント

例えば、統計数理基礎 レベル1では、

1+4+9+16+25+36をΣを用いて表せる

といった基礎レベルから、機械学習レベル3では、

機械学習 バイアスとバリアンスの関係を理解し、モデル選定を適切に行える

といった抽象的かつ包括的な表現のチェックもある。

これは課題が具体的で取り組みやすい。

また、 データサイエンス力(以下D/sci)・データエンジニアリング(以下D/eng)・ビジネス力(以下D/biz)の3領域 レベル1-3(以下L1-L3)でクロスした表を作成して、定量的に把握してみた。

cate L1 L2 L3 all
D/sci 54 68 58 180
D/eng 39 43 37 119
D/biz 30 49 44 123
all 123 160 139 422

レベル1から取り組み、可能なかぎり、Pythonや実装レベルに落とし込んで理解する。

データを処理するスキルがなければ、人工知能は構築できない。

それでは、レベル1からスタート。