2023-01-01から1年間の記事一覧

国会会議録検索システムから抽出した議事録データを使って国会議員の活動量を可視化するTableauダッシュボードを作った

背景/課題 投票した政治家が当選したあと、その政治家がちゃんと活動しているのか、私は把握できていない。大多数の市民もそんな感じではないかと思う。この場合、最もらしいマニフェストを唱えるが、行動が伴っていない政治家に投票してしまう可能性がある…

乳幼児を寝かしつけるのが少し楽になった

生後2~3ヶ月の乳幼児を育てている。だいたい起きてから1時間半ぐらい経つとぐずりだすので寝かしつけることになるが、すんなりとは寝てくれないことがほとんどである。 いろいろ試す中で、割と早めに寝てくれる方法を見つけたので、まとめておく。誰かの参考…

Tableau Publicでテキスト ファイルを読み込むと一部のデータがnullになってしまうときはGoogle Spreadsheetを使う

問題 ローカルにあるCSVファイルをTableau Publicに取り込んだところ、一部の値がnullになってしまった。 対象の列は数値と文字列を含んでおり、データベースにあるときは文字列になっているが、CSVに掃き出した時点でスキーマレスになり、Tableau Public側…

前か後ろにある不要な文字列を除いて、間にある文字列のみを残す

課題 下記のような値をもつカラムがあるとき、 district (比)東京 東京12 以下のように加工処理したい。 district 東京 東京 前提 BigQueryを想定します。 解決策 regex_replace関数を使って、キャプチャグループを利用してOR演算子で''に変換すればよいだけ…

アメリカでデータエンジニアとして就職するための準備

今年の10月くらいから就職活動を始めたいと思っているが、そもそもどんな準備をして就職活動に臨めばいいのかわからない。 まずは情報収集から、ということで「ここらへん参考にすると良いよ/良さそう」という情報源をまとめる。 前提 2023年1月にアメリカの…

継続的にアウトプットし続けることができない

なぜできないか? ブログを開いて編集するのが面倒くさい。 そもそもブログを書いているという意識が気分を滅入らせる(文章を整えなきゃいけないとか) ブログということを意識しなければいいのでは? どうやらはてなブログはメールで記事を投稿できるらし…