2024.02.16 Webプロモーション
GA4で日本語のPDFファイルが文字化けしてしまう場合の対処法
GA4のイベント「file_download」でダウンロードされたPDFの解析を行う際に、PDFのファイル名が日本語だと「%E4%・・・.pdf」というように文字化けしてしまい、該当のPDFファイルがどれか分からない、という状況に困っている方がいると思います。
今回は、上記のような日本語PDFファイルの分析についてご紹介します。
なぜ日本語PDFファイルは文字化けしてしまうのか
そもそも日本語はURLに使用できないため、「%E4%・・・.pdf」のような形式が本来のURLとなります。そのため厳密には文字化けではなく、URLエンコードという処理が行われた結果ということになります。
どのPDFファイルが表示されたか判別することはできるのか
「URLエンコード・デコード」というツールが公開されているので、こちらを使用すると「%E4%・・・.pdf」のようなURL日本語に変換することができます。
https://tech-unlimited.com/urlencode.html
(使用方法)
・「デコードする」を選択
・文字列「%E5%88%B6%E4%BD%9C%E5%AE%9F%E7%B8%BE.pdf」を入力
・変換ボタンをクリック
・「制作実績.pdf」というPDF名が判明
上記のように操作することで、日本語PDFの名称を判別することができます。
根本的な解決について
毎回上記のような処理を行うことは手間になるため、
・PDF名を日本語ではなくアルファベットに変更する
・GA4で取得する値をファイル名ではなく、資料名(click_textなどで取得)に変更する
等が考えられます。
▼▼GA4に関するオンライン無料セミナーを開催▼▼
【無料セミナー】(GA4初学者向け)必要情報の見つけ方をイチから学ぶ
~標準レポート・探索レポートの基本操作付き