文部科学省が公開している大学一覧のエクセルファイルから、大学情報をパースしデータとして使いやすい形で出力するプログラムです。
使用にはPythonの実行環境が必要です。
-
文部科学省のサイトよりエクセルファイルをダウンロードします。
-
Json出力の場合、以下のpythonコマンドを実行し、出力を行います。
python japanese_school_parser.py <入力Excelファイルパス> <出力ファイルパス>
# 例 python japanese_school_parser.py 20220415_mxt_daigakuc01_000021808_03-7.xlsx 20220415_mxt_daigakuc01_000021808_03-7.json # => コマンドを実行したディレクトリに20220415_mxt_daigakuc01_000021808_03-7.jsonが生成されます。
Pythonのdict型で出力を行いたい場合は以下の関数を呼び出します。
schools = parse_schools_to_dict(source_path)
- Json
- Python dict型
- yaml
- 学校コード
- 学長
- 学長任期
- 所在地
- 電話番号
- 設置者
- 役職
- 役職者名
- 名称
- 所在地
- 電話番号
- 附置研究所名
- 所在地住所
- 電話番号
- 設置年月日
- 備考
- 附置研究所名
- 附属施設
- 所在地住所
- 電話番号
- 学部
- 学科
- 都道府県
- 市区町村
- 修業年限
- 入学定員
- 編入定員
- 編入(夜間)
- 研究科
- 専攻
- 都道府県
- 市区町村
- 夜間昼夜
- 修士/博士 前期課程
- 博士後期課程
- 博士課程(一貫制)
- 専門職学位課程
- 編入定員
- 年月
- 沿革
- 年月
- 沿革
現状作成者が個人的に使用する部分のみ実装しています。
Issueでご要望があれば追加実装を行います。
Pullrequestもお待ちしています。
出典:文部科学省ホームページ
本プログラムは上記出典のデータを加工して出力しています。