2019-01-01から1年間の記事一覧
花粉症から逃れるため、 フルリモートで東京の仕事を対応しつつ、 自主的に2019.04沖縄合宿を実施しておりました。 1ヶ月弱滞在し、非常に有意義な合宿でした。 クラウド、サーバレスの盛り上がりを体感し、 今後は、クラウド・サーバレス関連も重点的にウォ…
概要 Webページを評価する切り口は、さまざまな種類があります。 表示回数 クリック数 直帰率 平均滞在時間 CV数 各種ソーシャルいいね数 ... もし各切り口の単位がバラバラで、ボリュームも異なり、優劣がつけられない場合、 総合的に判断することが難しく…
概要 JupyterNotebookは、セル単位でプログラムを実行できるインターフェイスがあります。 ただ、変数の値を少し変更したり、 設定条件を変えたい場合は、 セルの中身のプログラムを変更する必要があります。 もう少し、マウス操作や、直感的に数値変更でき…
概要 データ分析など、ブラウザ上で対話的にPythonコマンドを実行できる、 Jupyter Notebookでは、R言語やRubyといった他の言語のカーネルを インストールすることで、他言語も使うことができます。 以下導入方法です。 Rカーネルの導入 パッケージインスト…
概要 RによるRFM分析をご紹介します。 RFM分析 とは、顧客を以下の3つの側面から分析する手法です。 R(Recency, 最近購買しているかどうか, 購買日付) F(Frequency, 頻繁に購買しているかどうか, 購買頻度) M(Monetary, 高額に購買しているかどうか, 購買金…
概要 Rによるデシル分析についてご紹介します。 デシル分析とは、売上など特定の数値で顧客データを並び替えたあとに、10等分する分析です。 上位に集中する特徴を捉えて、次の施策を考案するために活用します。 準備 データ まず、1カスタマー1データで売上…
概要 Rによる共分散・相関係数・ファイ係数の算出方法をご紹介します。 関数 2つの異なるデータ群の共分散を cov() で算出できます。 ただし、単位に依存するので、例えば、身長がm単位なのかcm単位なのかで共分散の値が異なります。 cov() : 共分散 共分散:…
概要 Rによる分散・標準偏差・Z得点・偏差値の算出方法をご紹介します。 関数 var(): 不偏分散 不偏分散を算出するには、var()を使います。 x <- c(10, 13, 8, 15, 8) x # [1] 10 13 8 15 8 # 不偏分散 var(x) # [1] 9.7 sd(): 標準偏差 標準偏差を算出する…
概要 Rによるバスケット分析方法をまとめました。 Rのバスケット分析パッケージを使えば、 すぐに詳細なバスケット分析ができます。 書籍『リテールデータ分析入門』のデータを使って、実際に分析してみます。 準備 データの準備 まず、商品カテゴリ(例:お…
概要 購買データから、同時に購入される商品の傾向を分析することを、 マーケットバスケット分析(ショッピングバスケット分析とも呼ばれる。以下バスケット分析) と呼びます。アソシエーション分析の一種です。 バスケット分析では、 「商品Aを買うときは、…
顧客の購買行動を測定したデータをリテールデータと呼びますが、 大規模なリテールデータに特化したRによる分析ノウハウが記載されている書籍です。 書誌情報 リテールデータ分析入門 上田隆穂/編著 田島博和/編著 奥瀬喜之/編著 斉藤嘉一/編著 出版社名…
R言語による統計学入門として、『Rによるやさしい統計学』が名著です。 その書誌情報です。 概要 Rによるやさしい統計学 | Ohmsha 著者山田 剛史 杉澤 武俊 村井 潤一郎 共著 定価2,916 円(本体2,700 円+税) A5 420頁 2008/01発行 ISBN978-4-274-06710-5 …