Microsoft Fabric(統合分析プラットフォーム)まとめ

Microsoft

Microsoft Fabricについて整理しました。 by ChatGPT Microsoft Fabricは、企業向けの包括的なデータ分析プラットフォームです。以下は、その概要、具体的な機能、および実用例に関する情報です：概要 Microsoft Fabricは、データ移動、データサイエンス、…

2024-01-12

Microsoft Learnまとめ

Microsoft

概要 Microsoft Learn: Build skills that open doors in your career Microsoft Learnは、Microsoft製品を最大限に活用するためのプラットフォームで、以下のような要素から構成されています。ドキュメント: 製品の使い方や機能に関する詳細な情報が記載さ…

2024-01-10

0-3章：Generative AI for Beginners講座( by Microsoft)まとめ

Microsoft AI

概要生成 AI アプリケーションの開発を始めるために必要な全知識を学べる 12 講座マイクロソフトのクラウド・アドボケイトが提供生成 AI アプリケーション構築の基礎知識を習得 URL Generative AI for Beginners https://microsoft.github.io/generative-…

2023-11-10

MLOpsプラットフォームwandb(Weights & Biases)まとめ

MLOps

wandb(Weights & Biases)とは Weights & Biases - 機械学習開発者のためのコラボレーションプラットフォーム https://www.wandb.jp/ Weights & Biasesは、開発者がより優れたモデルを迅速に構築できる機械学習プラットフォームです。W&Bの軽量で相互運用可能…

2021-09-13

OR(Operations Research)の概要・事例・Pythonサンプル

OR概要 ORとは：最適化手法の一種。オペレーションズ・リサーチ（英語：operations research、米）、オペレーショナル・リサーチ（英語：operational research、英[1]、略称：OR）は、数学的・統計的モデル、アルゴリズムの利用などによって、さまざまな…

2021-03-14

通信課程の帝京大学理工学部情報科学科３年次振り返り

Gerd AltmannによるPixabayからの画像前提昨年2020年4月に、以下のとおり、工学学士号取得のため、通信制大学に入学しておりました工学学士号を取得するため通信制の帝京大学理工学部情報科学科に３年次編入しました(2020.04) - kaekenのTech探究ブログ …

2020-10-04

個人開発(自社プロダクト)のメリット・デメリット・始め方・続け方・マネタイズについて

Product

tookapicによるPixabayからの画像背景長年、フリーランスとして受託開発をやってきましたが、結局時間を切り売りしたり、成果物を切り売りするだけで、労働収益であることには変わりないです今後は、受託・プロパー業務と並行して、利益相反しない範囲で…

2020-09-03

工学学士号を取得するため通信制の帝京大学理工学部情報科学科に３年次編入しました(2020.04)

近況・背景フルリモート案件対応しながら、去年2019年後半から今年2020年3月まで、海外を転々としてました東南アジア(フィリピン、ベトナム、タイ、マレーシア、シンガポール、インドネシア）やオーストラリアを観光・視察（ノマドワーク環境）しつつ、短…

2019-04-28

2019.04沖縄合宿で参加した勉強会一覧

花粉症から逃れるため、フルリモートで東京の仕事を対応しつつ、自主的に2019.04沖縄合宿を実施しておりました。 1ヶ月弱滞在し、非常に有意義な合宿でした。クラウド、サーバレスの盛り上がりを体感し、今後は、クラウド・サーバレス関連も重点的にウォ…

2019-02-24

R言語でWebページの総合ランキングを作る方法

R data-mining statistics

概要 Webページを評価する切り口は、さまざまな種類があります。表示回数クリック数直帰率平均滞在時間 CV数各種ソーシャルいいね数 ... もし各切り口の単位がバラバラで、ボリュームも異なり、優劣がつけられない場合、総合的に判断することが難しく…

2019-02-24

JupyterNotebookで対話的インターフェイスipywidgetsを使う方法

JupyterNotebook

概要 JupyterNotebookは、セル単位でプログラムを実行できるインターフェイスがあります。ただ、変数の値を少し変更したり、設定条件を変えたい場合は、セルの中身のプログラムを変更する必要があります。もう少し、マウス操作や、直感的に数値変更でき…

2019-02-21

JupyterNotebookでRを使う方法

R JupyterNotebook

概要データ分析など、ブラウザ上で対話的にPythonコマンドを実行できる、 Jupyter Notebookでは、R言語やRubyといった他の言語のカーネルをインストールすることで、他言語も使うことができます。以下導入方法です。 Rカーネルの導入パッケージインスト…

2019-02-17

RによるRFM分析

R data-mining

概要 RによるRFM分析をご紹介します。 RFM分析とは、顧客を以下の3つの側面から分析する手法です。 R(Recency, 最近購買しているかどうか, 購買日付) F(Frequency, 頻繁に購買しているかどうか, 購買頻度) M(Monetary, 高額に購買しているかどうか, 購買金…

2019-02-17

Rによるデシル分析

R statistics data-mining

概要 Rによるデシル分析についてご紹介します。デシル分析とは、売上など特定の数値で顧客データを並び替えたあとに、10等分する分析です。上位に集中する特徴を捉えて、次の施策を考案するために活用します。準備データまず、1カスタマー1データで売上…

2019-02-17

Rによる共分散・相関係数・ファイ係数の算出

R statistics

概要 Rによる共分散・相関係数・ファイ係数の算出方法をご紹介します。関数 2つの異なるデータ群の共分散を cov() で算出できます。ただし、単位に依存するので、例えば、身長がm単位なのかcm単位なのかで共分散の値が異なります。 cov() : 共分散共分散:…

2019-02-17

Rによる分散・標準偏差・Z得点・偏差値の算出

R statistics

概要 Rによる分散・標準偏差・Z得点・偏差値の算出方法をご紹介します。関数 var(): 不偏分散不偏分散を算出するには、var()を使います。 x <- c(10, 13, 8, 15, 8) x # [1] 10 13 8 15 8 # 不偏分散 var(x) # [1] 9.7 sd(): 標準偏差標準偏差を算出する…

2019-02-16

Rによるバスケット分析まとめ

R data-mining

概要 Rによるバスケット分析方法をまとめました。 Rのバスケット分析パッケージを使えば、すぐに詳細なバスケット分析ができます。書籍『リテールデータ分析入門』のデータを使って、実際に分析してみます。準備データの準備まず、商品カテゴリ（例：お…

2019-02-16

レコメンデーションに用いられる3つの指標まとめ

data-mining

概要購買データから、同時に購入される商品の傾向を分析することを、マーケットバスケット分析(ショッピングバスケット分析とも呼ばれる。以下バスケット分析）と呼びます。アソシエーション分析の一種です。バスケット分析では、「商品Aを買うときは、…

2019-02-16

『リテールデータ分析入門』書誌情報

R Book data-mining statistics

顧客の購買行動を測定したデータをリテールデータと呼びますが、大規模なリテールデータに特化したRによる分析ノウハウが記載されている書籍です。書誌情報リテールデータ分析入門上田隆穂／編著田島博和／編著奥瀬喜之／編著斉藤嘉一／編著出版社名…

2019-02-16

『Rによるやさしい統計学』書誌情報

R Book statistics

R言語による統計学入門として、『Rによるやさしい統計学』が名著です。その書誌情報です。概要 Rによるやさしい統計学 | Ohmsha 著者山田剛史杉澤武俊村井潤一郎共著定価2,916 円（本体2,700 円＋税） A5 420頁 2008/01発行 ISBN978-4-274-06710-5 …

2018-10-01

1章　ニューラルネットワークの復習 / 1.1　数学とPythonの復習 |『ゼロから作るDeep Learning２自然言語処理編』

Deep Learning NLP

1章ニューラルネットワークの復習まずはニューラルネットワークを復習する章なので、復習がてらコード部分を写経。 1.1 数学とPythonの復習 1.1.1 ベクトルと行列 >>> import numpy as np # numpyインポート >>> x = np.array([1,2,3]) # np.array()メソッ…

2018-10-01

『ゼロから作るDeep Learning２自然言語処理編』学習開始

Deep Learning NLP

『ゼロから作るDeep Learning２自然言語処理編』学習開始。『ゼロから作るDeep Learning』の続編で、自然言語処理・時系列データがメインテーマ。機械学習・深層学習の分野は、2年前に『ゼロから作るDeep Learning』を学習したときから比べて、ものすごい…

2018-02-04

(2018-02-04)気になるAI/ML/DL/DSネタ：2018年度前期東大AI講座、脳内イメージ映像化、GoogleドライブOCR、など

misc

実データで学ぶ人工知能講座（AIデータフロンティアコース）平成30年度前期募集のご案内講座について – 2018年度前期講座 – Learn.AI 東京大学では、大阪大学とともに、国立研究開発法人新エネルギー・産業技術総合開発機構（NEDO）の委託を受け、人工知能…

2018-02-03

Python/scikit-learn/分類精度の評価指標について

Python scikit-learn

前回は、機械学習のクラス分類精度を評価するために、まず混同行列 (Confusion matrix)についてまとめました。 Python/scikit-learn/分類精度を評価する際に使われる混同行列 (Confusion matrix)について - データサイエンティストへの修行日記今回は、混同…

2018-02-03

(2018-02-03)気になるML/DL/DSネタ：教えない先生、Custom Vision Service、『仕事ではじめる機械学習』著者座談会

misc

未来を変える技術20 - AI活用で「教えない先生」が登場、1800億円に膨らむ教育×IT市場：ITpro 同社は2014年から東京大学の松尾豊特任准教授と共同で、生徒が動画のどこで躓いたかやコンテンツ間の関連性を分析。先に何を学べば躓かないのかや何を復習すれば…

2018-02-02

Python/scikit-learn/分類精度を評価する際に使われる混同行列 (Confusion matrix)について

Python scikit-learn

機械学習のクラス分類精度を評価するために、混同行列 (Confusion matrix)が用いられます。 Confusion matrix - Wikipedia In the field of machine learning and specifically the problem of statistical classification, a confusion matrix, also known …

2018-02-02

(2018-02-02)気になるAI/ML/DSニュース・記事・サービスなど

misc

米国500社の財務諸表ビッグデータ分析で見えた7つの事実 - データで見る世界バイアスを取り除く方法はただ一つ。データ分析です。データは嘘をつきません。賢そうな人の意見を鵜呑みにするのではなく、自分で生のデータを分析すれば、事実にたどり着けます…

2018-02-02

Python/pandas公式チートシート解説：前処理のゴールとなるTidy Dataとは

Python Pandas

pandas githubのドキュメントに公式のチートシートがアップされています。 github.com このpandasチートシートには、重要な概念やコマンド実行方法が整理されていますので、項目をひとつずつ解説していきます。なお、このチートシートは、もともとR言語のチ…

2018-02-01

Python/pandas エンコードされたone-hotデータをデコードする方法

Pandas Python

機械学習の学習用データでよく使われるone-hotエンコーディングされたデータがあります。 one-hotエンコーディング処理は、さまざまなライブラリで実装されています。 sklearn.preprocessing.OneHotEncoder — scikit-learn 0.19.1 documentation http://scik…

2018-02-01

気になったAI/ML/DSニュース・サービスなど(2018-02-01)

misc

Google、オープンソース機械学習ライブラリの最新版「TensorFlow 1.5」を発表：使い勝手やモバイル対応、GPUサポートが向上 - ＠IT http://www.atmarkit.co.jp/ait/articles/1801/30/news038.html 24研究室と1日で会える！人工知能・IoT・ビッグデータ分野で…

kaeken(嘉永島健司)のTech探究ブログ

主に情報科学/情報技術全般に関する知見をポストします。（最近は、特にData Science、機械学習、深層学習、統計学、Python、数学、ビッグデータ）

Microsoft Fabric(統合分析プラットフォーム)まとめ

Microsoft Learnまとめ

0-3章：Generative AI for Beginners講座( by Microsoft)まとめ

MLOpsプラットフォームwandb(Weights & Biases)まとめ

OR(Operations Research)の概要・事例・Pythonサンプル

通信課程の帝京大学理工学部情報科学科３年次振り返り

個人開発(自社プロダクト)のメリット・デメリット・始め方・続け方・マネタイズについて

工学学士号を取得するため通信制の帝京大学理工学部情報科学科に３年次編入しました(2020.04)

2019.04沖縄合宿で参加した勉強会一覧

R言語でWebページの総合ランキングを作る方法

JupyterNotebookで対話的インターフェイスipywidgetsを使う方法

JupyterNotebookでRを使う方法

RによるRFM分析

Rによるデシル分析

Rによる共分散・相関係数・ファイ係数の算出

Rによる分散・標準偏差・Z得点・偏差値の算出

Rによるバスケット分析まとめ

レコメンデーションに用いられる3つの指標まとめ

『リテールデータ分析入門』書誌情報

『Rによるやさしい統計学』書誌情報

1章　ニューラルネットワークの復習 / 1.1　数学とPythonの復習 |『ゼロから作るDeep Learning２自然言語処理編』

『ゼロから作るDeep Learning２自然言語処理編』学習開始

(2018-02-04)気になるAI/ML/DL/DSネタ：2018年度前期東大AI講座、脳内イメージ映像化、GoogleドライブOCR、など

Python/scikit-learn/分類精度の評価指標について

(2018-02-03)気になるML/DL/DSネタ：教えない先生、Custom Vision Service、『仕事ではじめる機械学習』著者座談会

Python/scikit-learn/分類精度を評価する際に使われる混同行列 (Confusion matrix)について

(2018-02-02)気になるAI/ML/DSニュース・記事・サービスなど

Python/pandas公式チートシート解説：前処理のゴールとなるTidy Dataとは

Python/pandas エンコードされたone-hotデータをデコードする方法

気になったAI/ML/DSニュース・サービスなど(2018-02-01)