kaekenのData Science探究ブログ

主にData Science、機械学習、深層学習、統計学、Python、数学、ビッグデータに関する知見をポストします。

statistics

R言語でWebページの総合ランキングを作る方法

概要 Webページを評価する切り口は、さまざまな種類があります。 表示回数 クリック数 直帰率 平均滞在時間 CV数 各種ソーシャルいいね数 ... もし各切り口の単位がバラバラで、ボリュームも異なり、優劣がつけられない場合、 総合的に判断することが難しく…

Rによるデシル分析

概要 Rによるデシル分析についてご紹介します。 デシル分析とは、売上など特定の数値で顧客データを並び替えたあとに、10等分する分析です。 上位に集中する特徴を捉えて、次の施策を考案するために活用します。 準備 データ まず、1カスタマー1データで売上…

Rによる共分散・相関係数・ファイ係数の算出

概要 Rによる共分散・相関係数・ファイ係数の算出方法をご紹介します。 関数 2つの異なるデータ群の共分散を cov() で算出できます。 ただし、単位に依存するので、例えば、身長がm単位なのかcm単位なのかで共分散の値が異なります。 cov() : 共分散 共分散:…

Rによる分散・標準偏差・Z得点・偏差値の算出

概要 Rによる分散・標準偏差・Z得点・偏差値の算出方法をご紹介します。 関数 var(): 不偏分散 不偏分散を算出するには、var()を使います。 x <- c(10, 13, 8, 15, 8) x # [1] 10 13 8 15 8 # 不偏分散 var(x) # [1] 9.7 sd(): 標準偏差 標準偏差を算出する…

『リテールデータ分析入門』書誌情報

顧客の購買行動を測定したデータをリテールデータと呼びますが、 大規模なリテールデータに特化したRによる分析ノウハウが記載されている書籍です。 書誌情報 リテールデータ分析入門 上田隆穂/編著 田島博和/編著 奥瀬喜之/編著 斉藤嘉一/編著 出版社名…

『Rによるやさしい統計学』書誌情報

R言語による統計学入門として、『Rによるやさしい統計学』が名著です。 その書誌情報です。 概要 Rによるやさしい統計学 | Ohmsha 著者山田 剛史 杉澤 武俊 村井 潤一郎 共著 定価2,916 円(本体2,700 円+税) A5 420頁 2008/01発行 ISBN978-4-274-06710-5 …