kaeken(嘉永島健司)のTech探究ブログ

主に情報科学/情報技術全般に関する知見をポストします。(最近は、特にData Science、機械学習、深層学習、統計学、Python、数学、ビッグデータ)

statistics

R言語でWebページの総合ランキングを作る方法

概要 Webページを評価する切り口は、さまざまな種類があります。 表示回数 クリック数 直帰率 平均滞在時間 CV数 各種ソーシャルいいね数 ... もし各切り口の単位がバラバラで、ボリュームも異なり、優劣がつけられない場合、 総合的に判断することが難しく…

Rによるデシル分析

概要 Rによるデシル分析についてご紹介します。 デシル分析とは、売上など特定の数値で顧客データを並び替えたあとに、10等分する分析です。 上位に集中する特徴を捉えて、次の施策を考案するために活用します。 準備 データ まず、1カスタマー1データで売上…

Rによる共分散・相関係数・ファイ係数の算出

概要 Rによる共分散・相関係数・ファイ係数の算出方法をご紹介します。 関数 2つの異なるデータ群の共分散を cov() で算出できます。 ただし、単位に依存するので、例えば、身長がm単位なのかcm単位なのかで共分散の値が異なります。 cov() : 共分散 共分散:…

Rによる分散・標準偏差・Z得点・偏差値の算出

概要 Rによる分散・標準偏差・Z得点・偏差値の算出方法をご紹介します。 関数 var(): 不偏分散 不偏分散を算出するには、var()を使います。 x <- c(10, 13, 8, 15, 8) x # [1] 10 13 8 15 8 # 不偏分散 var(x) # [1] 9.7 sd(): 標準偏差 標準偏差を算出する…

『リテールデータ分析入門』書誌情報

顧客の購買行動を測定したデータをリテールデータと呼びますが、 大規模なリテールデータに特化したRによる分析ノウハウが記載されている書籍です。 書誌情報 リテールデータ分析入門 上田隆穂/編著 田島博和/編著 奥瀬喜之/編著 斉藤嘉一/編著 出版社名…

『Rによるやさしい統計学』書誌情報

R言語による統計学入門として、『Rによるやさしい統計学』が名著です。 その書誌情報です。 概要 Rによるやさしい統計学 | Ohmsha 著者山田 剛史 杉澤 武俊 村井 潤一郎 共著 定価2,916 円(本体2,700 円+税) A5 420頁 2008/01発行 ISBN978-4-274-06710-5 …