熱中症搬送人員数のオフセット項を65歳以上人口に変更してみる

 以前の記事では都道府県人口の対数をオフセット項として一般化線形回帰分析を行った.実際のところ,年代別の搬送人員としては65歳以上の高齢者が圧倒的に多い.そのため,東京など労働人口の多いところでは予測性能が悪化する可能性がある.今回はオフセット項の都道府県人口を3区分に分け,65歳以上人口の対数をオフセット項として採用してみたところ予測性能が改善したと思われたので記事とした.

“熱中症搬送人員数のオフセット項を65歳以上人口に変更してみる” の続きを読む

熱中症搬送人員数に平均風速や平均雲量は影響するか

 熱中症搬送人員数に日最高気温と平均水蒸気圧が強く影響することは疑いの余地がない.他の気象条件として風速や雲量が負の影響をおよぼす可能性はないだろうか.言い換えると,風速が強ければ熱中症を発症する可能性が下がることは考えられないか,晴れよりも曇りや雨の日は熱中症を発症する可能性が下がることは考えられないかということである.

 前回の記事で熱中症データベースに平均風速をインポートした.詳細は割愛するが,同様の手順で平均雲量のデータもインポートできる.

 今回は説明変数として日最高気温,平均水蒸気圧に平均風速および平均雲量を加えて一般化線形モデルにて解析を行い,tree関数で可視化を試みた.

“熱中症搬送人員数に平均風速や平均雲量は影響するか” の続きを読む

熱中症搬送人員数に都道府県人口をオフセット項として追加し一般化線形回帰分析を行う

 以前の記事ではポアソン回帰モデルおよび負の二項分布モデルを用いて熱中症搬送人員数に対する日最高気温と平均水蒸気圧の回帰係数を推定した.

 人口10万人あたり何名の罹患者数,というのは割り算値である.総務省消防庁の公開している熱中症搬送人員数は都道府県ごとの搬送数であり,もともと都道府県別人口が異なるのだから搬送人員数を都道府県人口で割った割合のほうが指標として適切なのではないか,という指摘は一理ある.

 しかし,割り算値ではなく実数を解析すべきである.変形した観測値を統計モデルの応答変数にするのは不必要であるばかりか,誤った結果を導きかねないからである.割り算値からは確からしさの情報が失われること,変換された値の分布が不明であることから,割り算値は避けるべきである.その代わりに割り算の分母をオフセット項として線形予測子に組み込む手法がある.

 熱中症搬送人員数はカウントデータであり,その期待値は集計ゾーンの集計対象人口に依存する.都道府県人口をオフセット項とすることで,都道府県の人口規模の影響を調整した回帰分析ができる.今回は都道府県人口をオフセット項として線形予測子に組み込み,一般化線形回帰分析を行ってみた.

“熱中症搬送人員数に都道府県人口をオフセット項として追加し一般化線形回帰分析を行う” の続きを読む

ポアソン回帰モデルおよび負の二項分布モデルを用いて熱中症搬送人員数に対する日最高気温と平均水蒸気圧の回帰係数を推定する

 以前,熱中症搬送人員数は日最高気温と相関関係があり,片対数グラフで直線になると述べた.今回はポアソン回帰モデルおよび負の二項分布モデルで熱中症搬送人員数に対する日最高気温と平均水蒸気圧の回帰係数を推定する.

“ポアソン回帰モデルおよび負の二項分布モデルを用いて熱中症搬送人員数に対する日最高気温と平均水蒸気圧の回帰係数を推定する” の続きを読む

RおよびR Studioをインストールする

 統計解析のため,SPSS version21.0をかつて使用していた.IBMによると,2018年に同バージョンのサポートは終了している.インストールはできるがアクチベーションができないため問い合わせたところ,上記のような次第であった.そのため,やむなくRを使用することにした.

“RおよびR Studioをインストールする” の続きを読む

Excelのピボットテーブルでクロス集計から統計解析まで

 先日の鬼嫁/神嫁 婚前判定用アンケートを実施しますから鬼嫁/神嫁 婚前判定用アンケート結果に至るまでの解析の過程が誰かの役に立つだろうと考えて投稿する次第.ガチの統計手法だから一般社会人はとりあえずこれマスターしとけ.あ,大学で専門的にやってる人は除外ね.多変量解析とかはここでは扱わない.

 大まかな流れとしては次のような感じ.今回の投稿はできれば Excel のインストールしてある PC で見てくれ.スマホだと演習問題が解けない.

“Excelのピボットテーブルでクロス集計から統計解析まで” の続きを読む