一般社団法人データサイエンティスト協会 という団体からデータサイエンティスト(以下DS)になるための目安となる スキルチェックシートが提供されている。
DSスキルチェック | Data Scientist Society Journal DSスキルチェック | Data Scientist Society Journal
概要を抜粋
活用シーン
データサイエンティストのスキルレベルを把握したいときに 就職や転職時に求められているスキルを把握したいときに 大学や職場での学習・教育内容を決めるときに
機能
スマートフォンを使って、いつでもどこでもスキルチェックを行うことができます データサイエンス力(サイエンス)・データエンジニアリング(エンジニア)・ビジネス力(ビジネス)の3領域を棟梁レベル・独り立ちレベル・見習いレベルの3レベルごとに回答できます 全国平均などから、他者との相対的なスキルレベルが確認できる結果やデータサイエンティスト協会のフォーマット(Excel形式)でダウンロードできます 過去のチェック結果を保存。いつでもオンライン上で見直すことができます
以下にPDF版がある。
http://www.datascientist.or.jp/common/docs/skillcheck.pdf
カテゴリだけ抜粋
データサイエンス力 (項目数:180) 1 統計数理基礎 2 予測 3 検定/判断 4 グルーピング 5 性質・関係性の把握 6 サンプリング 7 データ加工 8 Data visualization 9 機械学習 10 時系列分析 11 言語処理 12 画像処理 13 音声処理 14 パターン発見 16 グラフィカルモデル 17 統計数理応用 18 シミュレーション/データ同化 19 最適化 データエンジニアリング力 (項目数:119) 1 環境構築 2 データ収集 3 データ構造 4 データ蓄積 5 データ加工 6 データ共有 7 プログラミング 8 ITセキュリティ ビジネス力 (項目数:123) 1 行動規範 2 論理的思考 3 プロセス 4 データの理解・検証 5 データ入手 6 意味合いの抽出、洞察 7 解決 8 事業に実装する 9 活動マネジメント
例えば、統計数理基礎 レベル1では、
1+4+9+16+25+36をΣを用いて表せる
といった基礎レベルから、機械学習レベル3では、
機械学習 バイアスとバリアンスの関係を理解し、モデル選定を適切に行える
といった抽象的かつ包括的な表現のチェックもある。
これは課題が具体的で取り組みやすい。
また、 データサイエンス力(以下D/sci)・データエンジニアリング(以下D/eng)・ビジネス力(以下D/biz)の3領域 レベル1-3(以下L1-L3)でクロスした表を作成して、定量的に把握してみた。
cate | L1 | L2 | L3 | all |
---|---|---|---|---|
D/sci | 54 | 68 | 58 | 180 |
D/eng | 39 | 43 | 37 | 119 |
D/biz | 30 | 49 | 44 | 123 |
all | 123 | 160 | 139 | 422 |
レベル1から取り組み、可能なかぎり、Pythonや実装レベルに落とし込んで理解する。
データを処理するスキルがなければ、人工知能は構築できない。
それでは、レベル1からスタート。