Youtubeタグ分析ツール
A downloadable project
Youtube 急上昇グラフ化ソフトウェアのアクセス部分を担当した。グループ1の開発物は YouTube の急上昇動画から動画情報を取得し、その情報を複数のパソコン間で情報伝達を行い、受信した別パソコンから情報を解析してタイトルや使用されているタグをグラフ化してエクセルファイルとして出力するシステムである。
´開発環境はGoogle Colab上でPythonを使用
役割
アクセス:嶋田美歌・大平純蓮
通信 :秋山勇人・ 角虎太郎
解析 :戸口恒瑛・ 宮下航輝
開発物の全体構成
グループ 1 は YouTube の急上昇動画から動画情報を取得し、その情報を複数のパソコン間で情報伝達を行い、受信した別パソコンから情報を解析して使用されているタグをグラフ化してエクセルファイルとして出力するプログラムを作成した。PC1(送信側)で YouTube から動画情報を取得し、json ファイルに出力する。作成した json ファイルを共有 Google ドライブに送信する。PC2(受信側)は共有 Google ドライブから動画情報が入った json ファイルを取得し、解析後にタグをグラフ化して出力する。
アクセス
Youtube Data APIからYoutubeの急上昇50件の動画情報を取得し、jsonファイルとして共有Googleドライブに送信する
Youtube Data APIの取得
Youtube Data APIの取得にはまずGoogleアカウントが必要であるため、必ず持っていない場合は作成する。そして下記手順でYoutube Data APIの登録を行い、APIキーを取得する。
1. Google Cloud Platformにアクセスした後新しいプロジェクトを作成
2. 新たに作成したプロジェクトにチェックを入れた状態で「APIとサービス」から「ダッシュボード」に移動
3. 移動後の画面から更に「APIライブラリ」に移動し検索画面から「YouTube Data API v3 」を探してその先のページへ移動
4. 移動後の画面にて「YouTube Data API v3」のAPIを有効にする
5. 「認証情報」の画面から「認証情報作成」のボタンを押下し、APIキーを取得
Youtubeの急上昇から動画を取得
取得したAPIキーを本文のプログラムにある「API_KEY = ここに入力」に入力するとYouTubeの急上昇の動画50件の情報がjsonファイルとして共有フォルダに出力される。
取得情報
1件の動画に対して以下の情報を取得できる。
結果が何ページあるか、動画のID、動画の公開日、チャンネルID、動画説明、サムネイル画像URL、動画に付けられたタグ、動画のカテゴリ、再生時間、再生回数、高評価、低評価、コメント数、埋め込みコード
通信
送信側は、 アクセス部で作成した動画情報の入ったJSONファイルを共有用Googleドライブ内のフォルダに格納する。解析側は、受信側のPCで共有ドライブ内のJSONファイルから読み込み、動画情報を取得する構造になっている。
通信部分のやり方
3.2.1 初回の実行時のみ行う通信準備のやり方
1. Google colab上でGoogle Driveのマウント(紐づけ)を行う。このとき、自身のGoogleアカウントにログインし、認証を行う。
2. GoogleDriveにMyDriveの直下に共有用フォルダを作成する。この時、フォルダのアクセス設定からリンクを知っているユーザーが誰でも編集可に設定する。
3. 作成した共有用フォルダを通信を行うPCにマウントしたGoogleアカウントにURLを共有する
4. 共有された個人はMyDriveの直下に共有用フォルダのショートカットを作成する。
通信部分実行時のやり方
1.送信側PCのプログラムでアクセス部から渡される動画情報をJSONファイルとしてGoogle Driveの共有フォルダに作成する。
2. 受信側PCのプログラムで Google Driveの共有フォルダにアクセスし、JSONファイルをPCに読み込む。
解析
通信から貰ったjsonファイルの情報からタグに関する情報だけを取り出してcsvファイルとして保存。そのcsvファイルのタグから重複している数を数えて、重複しているタグだけを抽出してExcelファイルにグラフとして出力する構造となっている。
解析部分のやり方
1.Google Drive のマウント済みのパソコンでjsonファイルを配列に読み込んでout_name.csvにタグの名前を出力する。
2.out_name.csvにあるタグ一覧からタグの重複をカウントしてカウント結果をdata.xlsxに保存する。
3.data.xlsxのうち重複があったものに関してだけを抽出し、重複した個数を縦軸、タグ名を横軸としてsort.xlsxにグラフを出力する。
Status | Released |
Category | Other |
Author | Masio07063 |
Leave a comment
Log in with itch.io to leave a comment.