前回はマルコフ連鎖モンテカルロ法にて熱中症搬送人員数をベイズ推定した.今回は空間相関を考慮した一般化線形モデル(ポアソンCARモデル)で熱中症搬送人員数をベイズ推定しようと試みた.結論から言うとうまく行っていない.途中でエラーが出てモデル構築に失敗する.その経過を記事とした.
熱中症搬送人員数をマルコフ連鎖モンテカルロ法でベイズ推定する
空間統計を勉強している.空間相関を考慮した一般化線形モデルが地域ごとのカウントデータやバイナリーデータをモデル化するために提案されている.今回はCARモデルを扱う.CARBayesでは空間相関を考慮しない通常のポアソン回帰モデルも扱えたため備忘録として公開する.
都道府県別の熱中症搬送人員数の予測と実際をEXCELの組み合わせグラフで描く
前回の記事では2019年の都道府県別の熱中症搬送人員数を1枚のグラフで描いた.今回は都道府県別に2008年から2021年までの熱中症搬送人員数の予測と実際をEXCELの組み合わせグラフで描く.
Heat-related mortality: a review and exploration of heterogeneityというレビューでは人口密度が高いほど熱の影響が大きいことが示されている.その理由として高度に設計された環境では蓄熱量が大きく,換気が悪く,自動車やエアコン等の熱源が局在するいわゆる都市のヒートアイランド現象が起きているためであると説明している.
それを受けて,詳細は割愛するが,都道府県総人口をその可住地面積(e-Statより)で割った人口密度を投入してみた.するとその係数は大きさこそ小さいものの,符号は負となり,投入前よりもAICが改善した(488368->478801).人口密度が大きいほど搬送数が減少するという意味である.これはにわかには信じがたい.考えられる理由として,日本においては人口密度の高い都市部ほど空調導入率が高い可能性がある.しかし,空調導入率そのものの指標がないため,検証は困難である.
2019年の熱中症搬送人員数の予測と実際をEXCELの組み合わせグラフで描く
これまでの記事で日最高気温と平均水蒸気圧,各都道府県65歳以上人口および月から熱中症の搬送人員数を予測する回帰式の回帰係数を推定してきた.
今回はその回帰式を元に実際のデータと比較してみたい.対象は2019年の47都道府県とする.
暑熱馴化を考慮して熱中症搬送人員数を予測するモデルを構築する
人体には暑熱馴化という機構がある.暑さに体が慣れることである.この機構を取り込んだモデルを構築してみた.
熱中症搬送人員数に平均風速や平均雲量は影響するか
熱中症搬送人員数に日最高気温と平均水蒸気圧が強く影響することは疑いの余地がない.他の気象条件として風速や雲量が負の影響をおよぼす可能性はないだろうか.言い換えると,風速が強ければ熱中症を発症する可能性が下がることは考えられないか,晴れよりも曇りや雨の日は熱中症を発症する可能性が下がることは考えられないかということである.
前回の記事で熱中症データベースに平均風速をインポートした.詳細は割愛するが,同様の手順で平均雲量のデータもインポートできる.
今回は説明変数として日最高気温,平均水蒸気圧に平均風速および平均雲量を加えて一般化線形モデルにて解析を行い,tree関数で可視化を試みた.
一般化線形混合モデルを用いて熱中症搬送人員数に対する日最高気温と平均水蒸気圧の回帰係数を推定する
総務省消防庁の公開している熱中症搬送人員数は都道府県ごとに毎日データを反復抽出しているとも言える.複数の都道府県から繰り返しデータを取るのは独立した反復ではなく,疑似反復と考えられる.このような場合,都道府県単位で差が生じると考えられ,一般化線形混合モデルを用いて回帰係数を推定する必要がある.
今回はRのglmmML()関数を用いて一般化線形混合モデルを用いた回帰係数の推定を行った.
熱中症搬送人員数に都道府県人口をオフセット項として追加し一般化線形回帰分析を行う
以前の記事ではポアソン回帰モデルおよび負の二項分布モデルを用いて熱中症搬送人員数に対する日最高気温と平均水蒸気圧の回帰係数を推定した.
人口10万人あたり何名の罹患者数,というのは割り算値である.総務省消防庁の公開している熱中症搬送人員数は都道府県ごとの搬送数であり,もともと都道府県別人口が異なるのだから搬送人員数を都道府県人口で割った割合のほうが指標として適切なのではないか,という指摘は一理ある.
しかし,割り算値ではなく実数を解析すべきである.変形した観測値を統計モデルの応答変数にするのは不必要であるばかりか,誤った結果を導きかねないからである.割り算値からは確からしさの情報が失われること,変換された値の分布が不明であることから,割り算値は避けるべきである.その代わりに割り算の分母をオフセット項として線形予測子に組み込む手法がある.
熱中症搬送人員数はカウントデータであり,その期待値は集計ゾーンの集計対象人口に依存する.都道府県人口をオフセット項とすることで,都道府県の人口規模の影響を調整した回帰分析ができる.今回は都道府県人口をオフセット項として線形予測子に組み込み,一般化線形回帰分析を行ってみた.
ポアソン回帰モデルの回帰曲線をRで描く
前回の記事では熱中症搬送人員数に対する日最高気温と平均水蒸気圧の影響をポアソン回帰モデルまたは負の二項分布モデルを用いて回帰係数を求めた.今回はポアソン回帰モデルの回帰曲線をRで描く.
ポアソン回帰モデルおよび負の二項分布モデルを用いて熱中症搬送人員数に対する日最高気温と平均水蒸気圧の回帰係数を推定する
以前,熱中症搬送人員数は日最高気温と相関関係があり,片対数グラフで直線になると述べた.今回はポアソン回帰モデルおよび負の二項分布モデルで熱中症搬送人員数に対する日最高気温と平均水蒸気圧の回帰係数を推定する.
“ポアソン回帰モデルおよび負の二項分布モデルを用いて熱中症搬送人員数に対する日最高気温と平均水蒸気圧の回帰係数を推定する” の続きを読む