国会会議録検索システムから抽出した議事録データを使って国会議員の活動量を可視化するTableauダッシュボードを作った

背景/課題

投票した政治家が当選したあと、その政治家がちゃんと活動しているのか、私は把握できていない。大多数の市民もそんな感じではないかと思う。この場合、最もらしいマニフェストを唱えるが、行動が伴っていない政治家に投票してしまう可能性がある。理想の市民としては、その政治家の当選後の活動を監視し、行動が伴っていなければ、次の選挙では投票しないようにしたい(あるいは、頑張っている人に投票できるようにしたい)。

しかし、市民も毎日忙しいので、当選後の活動を監視し続けるのは簡単なことではない。せいぜいできることといえば、メディアが切り取った事実をニュースとして受け止めるぐらいである。

そこで、一生懸命監視し続けなくても、自分の選挙区の政治家がちゃんと働いているのか確認できるようなダッシュボードを作ってみた。

何を作ったか

国会議員が参加した会議*1を集計して定量化することにした。

The Activity of Japanese Politicians - 国会活動の定量化

当然のことながら、国会議員の主な仕事場は衆/参両院の本会議、委員会等である。地元での活動、様々な会合への参加、裏での根回し、メディアへの露出など、活動の場はいろいろあるだろうが、主たる活動の場は国会や各種委員会であることで間違いはないだろう。そこで活動していない者は仕事をしていないと見られても仕方がないとも言える。

そして、この主たる仕事場の活躍ぶりは検索可能な議事録データとして、国の方から公式に公開してくれている。

国会会議録検索システム

今回作ったThe Activity of Japanese Politicians - 国会活動の定量化は、第207回(2021/12/6-2021/12/21)から第211回(2023/1/23-2023/6/21)までの議事録データを取得し、集計したものである*2

何がわかるか

このダッシュボードでは、選挙区ごとに選出された政治家の活動状況がわかるようにした。また、複数会期を通じたトレンドから、頑張っている時期があったり、常に活動していないな、などもわかる。

実際にダッシュボードを眺めた個人の感想は以下である。

  • 自分が住んでいた選挙区の政治家はまぁまぁ活動していそう
  • メディアでよく見かけるあの政治家は実は全然会議に参加していなかったりする
  • 大臣などの役職につくとやたら活動量が増える(質疑応答に立つので当然ではある)
  • 大阪は維新が強いけど、活動も活発なので、大阪府民の声は国会活動にも反映されていると言えそう

参考文献

(1ページ目)国会議員は仕事してるの? 72人もいる「トリプルゼロ」とは | AERA dot. (アエラドット)

有名な政治家が実は全然発言していないことは、数年前にも特集されたようである。

国会会議録検索システム検索用APIを使って国会での発言を分析してみた - Qiita

国会会議録検索システムAPIのご紹介|e-TEA

国会会議録検索システムのデータを利用したアドホックな分析事例はいくつかあるが、ダッシュボードにして継続的な監視を目指した事例はこれが初めてではないかと思われる。

今後の課題

データ基盤を整備したり、深掘って分析できるようにしたりなど、趣味プロジェクトとして育てたい。

*1:出席し発言したことをもって「参加した」とし、ダッシュボード上では「発言を伴う会議出席回数」とした

*2:本記事執筆時点

乳幼児を寝かしつけるのが少し楽になった

生後2~3ヶ月の乳幼児を育てている。だいたい起きてから1時間半ぐらい経つとぐずりだすので寝かしつけることになるが、すんなりとは寝てくれないことがほとんどである。

いろいろ試す中で、割と早めに寝てくれる方法を見つけたので、まとめておく。誰かの参考になればうれしい。

寝かしつけ方

用意するもの

  • スワドル(おくるみ)
  • おしゃぶり(赤ちゃんが気に入っているやつ)
  • 胎内音BGM(うちは↓を使っている)

手順

  1. ぐずり出したら暗めの静かな部屋に連れて行く。
  2. スワドルで割ときつめにくるむ。
  3. 胎内音BGM(iPhoneで音量MAX)を流し、おしゃぶりを咥えさせる。
  4. おしゃぶりを離そうとしても、しばらくは咥えさせようとしてみる。
  5. 親の手で赤ちゃんの両眼を隠して暗くする(何も見えないようにする)。
  6. 赤ちゃんが寝始めるまで両眼を隠し続ける。

5, 6がうちの子には効果的で、寝かしつけるまでの時間がぐっと短くなった(もちろんそうはうまくいかないことも全然ある)。

Tableau Publicでテキスト ファイルを読み込むと一部のデータがnullになってしまうときはGoogle Spreadsheetを使う

問題

ローカルにあるCSVファイルをTableau Publicに取り込んだところ、一部の値がnullになってしまった。 対象の列は数値と文字列を含んでおり、データベースにあるときは文字列になっているが、CSVに掃き出した時点でスキーマレスになり、Tableau Public側が適切なデータ型を推測できなかったようだ。

同様の問題はすでに報告されているが、解決方法を補足しておく。

kb.tableau.com

解決方法

上記のtableauの回答では、

  1. CSVではなくExcelを利用する
  2. Schema.iniファイルを利用する

なので、要するにスキーマを指定しろということだと思う。 2はレガシー接続で、最近のtableauではサポートは終了したとのことなので、あまりいい方法ではない。 1はExcelがインストールされていればよいが、私はMacを使っていてMS Office製品が入っていないので、そのまま適用することはできない。

Tableau PublicではローカルからのアップロードとGoogle Driveへの接続のみが可能なので、Google Spreadsheetでなんとかするしかない。 今まで知らなかったのだが、Google Spreadsheetでもデータ型を指定することができるらしい。

www.officeisyours.com

そこで、対象の列を指定して、Format → Numberと見てみると、Automaticとなっていたので、これをPlain Textに変更した。 再度、Tableau Publicから読み込んでみると、nullはなくなり、本来の文字列が読み込まれている。

前か後ろにある不要な文字列を除いて、間にある文字列のみを残す

課題

下記のような値をもつカラムがあるとき、

district
(比)東京
東京12

以下のように加工処理したい。

district
東京
東京

前提

BigQueryを想定します。

解決策

regex_replace関数を使って、キャプチャグループを利用してOR演算子で''に変換すればよいだけだった。

select 
  regexp_replace(district, r'(\(\D\))|\d','') as district
from table

アメリカでデータエンジニアとして就職するための準備

今年の10月くらいから就職活動を始めたいと思っているが、そもそもどんな準備をして就職活動に臨めばいいのかわからない。 まずは情報収集から、ということで「ここらへん参考にすると良いよ/良さそう」という情報源をまとめる。

前提

  • 2023年1月にアメリカのワシントン州に越してきた。
  • 移住前は東京の事業会社でデータエンジニアをやっていた。
  • TOEICのスコアは900ぐらいだが、英語力に自信はない。
  • これまでのところ、地元のコミカレでESLに参加したり、趣味プロジェクトをしたり、育児をしたりして過ごしている。
  • アメリカでもデータエンジニアのポジションに就きたいと思っている。

情報収集源

amzn.asia 妻から勧められて読んだ。全体感を理解できてよかった。

www.teamblind.com 匿名で各社の従業員が雑多に情報共有しているサイト。就職準備版ESLみたいなコースで参加者の一人が教えてくれた。ただし、仕事のメールアドレスを登録しない場合には多くの情報は閲覧できない。

joinhandshake.com 学生向けに仕事やインターンのポジションを紹介してくれるサービス。自分はコミカレのESLに通ったおかげで、学生メアドを手に入れたので利用できそう。

towardsdatascience.com data engineer interviewみたいなキーワードで適当に検索してヒットしたブログ記事。書かれていること全部を網羅してやっていくのは大変だなと思いつつも、こんだけ対策したらまぁどこかは拾ってくれそうな気がする。

github.com 上のブログ記事中で言及されていた本。

hackerx.org IT系エンジニアがネットワーキングするためのサービス。就職準備版ESLみたいなコースで出会ったAWSで働くエンジニアが教えてくれた。

今後の課題

現時点では、上述した情報源のほとんどを利用できていない。利用した上で得られた情報をまとめる作業は今後やっていきたい。

継続的にアウトプットし続けることができない

なぜできないか?

  • ブログを開いて編集するのが面倒くさい。
  • そもそもブログを書いているという意識が気分を滅入らせる(文章を整えなきゃいけないとか)

ブログということを意識しなければいいのでは?

  • どうやらはてなブログはメールで記事を投稿できるらしい。
  • 自分用メモみたいに書き殴って投稿しちゃうのは性に合うかもしれない?

メールを送りつけるスタイルでやってみよう

  • 1日何回送り付けても良い
  • インプットしたこととその処理(解釈)がアウトプットされたログと捉える