前回の記事(国土数値情報の二次医療圏テーブルの文字化けを解決する,医療機関テーブルに二次医療圏コードを追加する)では医療圏テーブル,医療機関テーブルを整備した.今回は人口動態予測を元に2045年の医療需給を予測する.
Fisherの直接確率を求めるストアドプロシージャをSQL Serverで定義する
前回の記事では階乗の自然対数を求めるユーザー定義関数をSQL Serverで作成するを記述した.今回はそのユーザー定義関数を用いてFisherの直接確率を求めるストアドプロシージャを記述する.
熱中症の搬送人員と最高気温との相関関係を可視化し閾値をχ二乗検定する
最高気温と熱中症の搬送人数との間に相関関係はあるだろうか.熱中症で救急搬送された人数は総務省の消防庁のサイトにある.これと気象庁のデータを結合してみた.
1920年から2015年までの都道府県別の5歳階級別人口推移
e-Stat を渉猟していると面白いファイルを見つけた.国勢調査は 1920 年から開始されており, 2020 年 3 月現在では最新の調査結果は 2015 年のものである.20 回分の人口データが一つのファイルにまとめられており,グラフ化するには格好のデータである.
年齢(5歳階級),男女別-都道府県(大正9年~平成27年)というファイルである.リンク先のページにはファイルが 3 つあるが,最後のものが最も粒度が細かいので,これをグラフ化する.
環境省の捕獲鳥獣数の統計を折れ線グラフにする
また面倒な統計を見つけてしまった.Power Query に食わせれば早いのかも知れないが,どうにも埒が明かないので手動でデータを整形することになった.頼むから第一正規形で公開してくれ…
IPAQガイドラインをクエリで表現するには
今回は泥臭い話になる.どんなプログラミングでも同じだが,一発で意図通りに動くことはまずない.試行錯誤の末,ようやくこんなものかという出来上がりである.SQL においても同じだ.クエリでは NULL の扱いが難しい.そんなところを感じ取ってもらえればと思う.