kaekenのData Science探究ブログ

主にData Science、機械学習、深層学習、統計学、Python、数学、ビッグデータに関する知見をポストします。

R

R言語でWebページの総合ランキングを作る方法

概要 Webページを評価する切り口は、さまざまな種類があります。 表示回数 クリック数 直帰率 平均滞在時間 CV数 各種ソーシャルいいね数 ... もし各切り口の単位がバラバラで、ボリュームも異なり、優劣がつけられない場合、 総合的に判断することが難しく…

JupyterNotebookでRを使う方法

概要 データ分析など、ブラウザ上で対話的にPythonコマンドを実行できる、 Jupyter Notebookでは、R言語やRubyといった他の言語のカーネルを インストールすることで、他言語も使うことができます。 以下導入方法です。 Rカーネルの導入 パッケージインスト…

RによるRFM分析

概要 RによるRFM分析をご紹介します。 RFM分析 とは、顧客を以下の3つの側面から分析する手法です。 R(Recency, 最近購買しているかどうか, 購買日付) F(Frequency, 頻繁に購買しているかどうか, 購買頻度) M(Monetary, 高額に購買しているかどうか, 購買金…

Rによるデシル分析

概要 Rによるデシル分析についてご紹介します。 デシル分析とは、売上など特定の数値で顧客データを並び替えたあとに、10等分する分析です。 上位に集中する特徴を捉えて、次の施策を考案するために活用します。 準備 データ まず、1カスタマー1データで売上…

Rによる共分散・相関係数・ファイ係数の算出

概要 Rによる共分散・相関係数・ファイ係数の算出方法をご紹介します。 関数 2つの異なるデータ群の共分散を cov() で算出できます。 ただし、単位に依存するので、例えば、身長がm単位なのかcm単位なのかで共分散の値が異なります。 cov() : 共分散 共分散:…

Rによる分散・標準偏差・Z得点・偏差値の算出

概要 Rによる分散・標準偏差・Z得点・偏差値の算出方法をご紹介します。 関数 var(): 不偏分散 不偏分散を算出するには、var()を使います。 x <- c(10, 13, 8, 15, 8) x # [1] 10 13 8 15 8 # 不偏分散 var(x) # [1] 9.7 sd(): 標準偏差 標準偏差を算出する…

Rによるバスケット分析まとめ

概要 Rによるバスケット分析方法をまとめました。 Rのバスケット分析パッケージを使えば、 すぐに詳細なバスケット分析ができます。 書籍『リテールデータ分析入門』のデータを使って、実際に分析してみます。 準備 データの準備 まず、商品カテゴリ(例:お…

『リテールデータ分析入門』書誌情報

顧客の購買行動を測定したデータをリテールデータと呼びますが、 大規模なリテールデータに特化したRによる分析ノウハウが記載されている書籍です。 書誌情報 リテールデータ分析入門 上田隆穂/編著 田島博和/編著 奥瀬喜之/編著 斉藤嘉一/編著 出版社名…

『Rによるやさしい統計学』書誌情報

R言語による統計学入門として、『Rによるやさしい統計学』が名著です。 その書誌情報です。 概要 Rによるやさしい統計学 | Ohmsha 著者山田 剛史 杉澤 武俊 村井 潤一郎 共著 定価2,916 円(本体2,700 円+税) A5 420頁 2008/01発行 ISBN978-4-274-06710-5 …