VTuberが投稿した歌ってみた動画の情報を人力で集めたデータセット
「誰(VTuber)が誰の何の曲を(誰と)いつ歌ったか」を集めている
csvファイルに以下のカラムで保存してある。
,vtuber,music,original,collab,collabVTuber,id,channelId,publishedAt,memo
(index)
: 行番号vtuber
: 実際に歌ったVTubermusic
: 歌った曲名original
: 曲を歌った本家の方- ~Pだったり、アーティスト名だったり、アニメのタイトルだったりして、誰の曲かが判別できればオッケー程度に考えてる
- ToDo: Best Practice
collab
: 誰かとコラボしているかcollabVTuber
: コラボしている場合、そのVTuber。id
: 動画の固有のid- URLは
https://www.youtube.com/watch?v={id}
となる
- URLは
channelId
: 投稿者固有のid- URLは
https://www.youtube.com/channel/{channelId}
となる
- URLは
publishedAt
: 動画が投稿された日時%Y-%m-%d %H:%M:%S
memo
: その他で注意しておくべき事- 3人で歌ってみた動画などは、3人目をここに記入
動作確認済み
Python >= 3.5
依存ライブラリのインストール
pip install -r requirements.txt
YouTube Data APIのキーの設定
YouTube Data API v3が使えるAPIキーを用意し、keys.py
をapp.py
と同じディレクトリ下に作成する。
API_KEY = "your API key"
とkeys.py
に記入する。
GUIで入力するため、flaskアプリを用いている。
そのためのflaskアプリの起動
python app.py
起動すると以下の画面が表示される
この入力フォームに動画のURLを入力
(https://www.youtube.com/watch?v={id}
の形式じゃないと送信することができない仕様になっています)
送信するとYouTubeAPIを使って必要な情報が出てきます
選択フォームは動画のタグから抽出しています。そこから正しいデータを選択します。
(存在しない場合はother
と書かれたチェックボックスをチェックすれば、自由に記入出来るフォームが現れるので、そちらに入力します)
コラボはデフォルトでNo
になっており、Yes
にすれば入力フォームが現れます
すべて入力したら、決定
を押します。そうすると、csvに保存されます。
-
データを間違えた
- プログラムを終了し、csvを直接書き換えましょう
-
URLが受け付けられない
- 既に存在しているidだと、データの追加はできないです。grepして上記と同様に書き換えます。