background-eyecatch
公開日:2021/04/16更新日:2022/10/17

ブラウザの履歴データから形態素解析でユーザーの嗜好を抽出するレシピ

3.9(35)
0

メニュー

概要

Googleの検索エンジンではユーザーの検索したキーワードセットや閲覧履歴などの情報が常に記録されていて、これを元にユーザーの嗜好を抽出してそれに対応したWeb広告を表示することでマーケティングを最適化しています。

更にいえば各Webページはクローラーと言うボットにより形態素解析され、どんなキーワードが含まれているか、どんな内容かを分析してGoogleのサーバーに記録し、これによりWebページをランク付けしたりどのようなキーワードで検索された際にページを表示するかを決定しています。

Google Chromeの閲覧履歴はPCのローカルファイルにSQLiteの形で保存されています。Pythonを使えばここから履歴データ取り出すことができ、更に形態素解析による分析も可能になります。

このレシピではPythonのJanomeと言う形態素解析ライブラリを使って、Google Chromeの履歴データから頻出単語を取り出してランキング化し、ユーザーのWebページ閲覧の傾向を分析する方法を解説します。

学べること

  • Google Chromeの履歴データのプログラム上での読み込み方がわかる
  • Janomeによる形態素解析の方法がわかる
  • 実際にGoogleが行なっているような、ブラウザ履歴からユーザーの嗜好を分析する方法がわかる

始める前のスキルセット

  • Python環境構築
  • Pythonモジュールをインストールできる

実務活用例

  • 自社のサービスのユーザーに合わせたマーケティングの最適化

キッチン

開発環境

  • WindowsまたはMacのローカル環境
  • Google Chromeのブラウザがインストールされていること

ツール

  • Python3.7(または3.8推奨)
  • Janome(ライブラリ。導入方法は後述します)

データセット

  • Google Chromeの閲覧履歴

調理

テスト

形態素解析の説明で正しくないものを選択してください。

Google chromeの履歴データはどこに保存されていますか?

履歴ファイルのアクセス履歴が保存されているテーブルを選択してください。

おすすめレシピ