以前の記事では都道府県人口の対数をオフセット項として一般化線形回帰分析を行った.実際のところ,年代別の搬送人員としては65歳以上の高齢者が圧倒的に多い.そのため,東京など労働人口の多いところでは予測性能が悪化する可能性がある.今回はオフセット項の都道府県人口を3区分に分け,65歳以上人口の対数をオフセット項として採用してみたところ予測性能が改善したと思われたので記事とした.
熱中症データベースに気象庁の日平均風速テーブルを追加する
気象庁の過去の気象データ・ダウンロードからは膨大な気象データをダウンロードできる.今回の記事ではSQL Server内に構築した熱中症データベースに日平均風速のテーブルを追加する.
都道府県別の納税義務者数と課税対象所得の推移を散布図に示す
eStatには納税義務者数(所得割)と課税対象所得のデータが1985年から2020年まである.今回は都道府県別の自治体ごとの納税義務者数と課税対象所得の散布図を示す.
熱中症の重症度別搬送人員数を最高気温と平均湿度別にプロットする
熱中症の搬送人員と最高気温との相関関係を可視化し閾値をχ二乗検定するでは最高気温と搬送数をプロットした.今回は気象庁から湿度のデータをダウンロードし,重症度別にプロットして可視化する.
QGIS でジオメトリを修復する
国土数値情報の河川データにはテーブル構造の不一致の他にも不具合がある.具体的には,LineString ジオメトリは 2 個以上の Point を必要とするが,特定の県のデータには Point が 1 個しかないジオメトリが複数ある.
アメリカ合衆国の税務情報を送信する
Google AdSense をこのブログで使用しているが,米国租税条約が適用されるため,フォーム W-8BEN から免除を申請した.
位置参照情報ダウンロードサービスから見る国土の形
国土交通省のサービスの一つに位置参照情報ダウンロードサービスがある.何気なくファイルをダウンロードして,思いがけない発見があったため,記事を書くことにした.
1920年から2015年までの都道府県別の5歳階級別人口推移
e-Stat を渉猟していると面白いファイルを見つけた.国勢調査は 1920 年から開始されており, 2020 年 3 月現在では最新の調査結果は 2015 年のものである.20 回分の人口データが一つのファイルにまとめられており,グラフ化するには格好のデータである.
年齢(5歳階級),男女別-都道府県(大正9年~平成27年)というファイルである.リンク先のページにはファイルが 3 つあるが,最後のものが最も粒度が細かいので,これをグラフ化する.
今後25年間の日本の都市の将来推計人口を EXCEL VBA で描く
これまでは日本の都市人口の過去の推移を見てきた.総務省には日本の都市人口の推移予測がある.今回はこのデータをグラフにする.
データを可視化するにあたり,重要なのは引き算である.強調すべき系列のみを強調するために,VBA の知識が欠かせない.
グラフの系列にデータラベルを表示する方法にはいくつかある.
敷き詰めた散布図にVBAでデータ系列を追加する
EXCEL VBAで複数の散布図を敷き詰めて並べるでは散布図を都道府県の数だけ敷き詰めて並べた.今回はその散布図一つ一つにデータ系列を追加する.