前回の記事では階乗を求めるユーザー定義関数を経てFisherの直接確率をストアドプロシージャで求めた.今回は四分表から感度と特異度を求めたい.
eSTATの小地域(町丁・字等別)毎の年齢(5歳階級、4区分)別、男女別人口をSQL ServerにBULK INSERTする
2020 年の国勢調査の結果がようやくeSTATに反映された.日本の市区町村よりも粒度の細かい小地域(町丁・字等別)の人口構成が公表されたのは2022年6月24日付である.今回はこのデータをSQL Serverに取り込んでみたい.
“eSTATの小地域(町丁・字等別)毎の年齢(5歳階級、4区分)別、男女別人口をSQL ServerにBULK INSERTする” の続きを読む
熱中症の重症度別搬送人員数を最高気温と平均湿度別にプロットする
熱中症の搬送人員と最高気温との相関関係を可視化し閾値をχ二乗検定するでは最高気温と搬送数をプロットした.今回は気象庁から湿度のデータをダウンロードし,重症度別にプロットして可視化する.
QGIS から SQL Server へデータをアップロードする際の勘所
QGIS から SQL Server 2008 R2 に空間データをアップロードする際には Shape2SQL というツールを使った.便利なツールではあるが,国土数値情報の河川データの属性テーブルの日本語が文字化けするという問題を抱えており,何とかならないかと試行錯誤した結果を備忘録として投稿する.
国土数値情報の河川データの属性テーブルを編集してみたが…
QGIS で国土数値情報の河川データの属性テーブルを覗いてみて,少し気になる点が見つかった.
新エネルギー・産業技術総合開発機構の太陽光スペクトルデータをピボットグラフで表現する
色の知覚(1)太陽光では,新エネルギー・産業技術総合開発機構の日射データが巨大すぎてインポートできなかった.データをある程度絞り込むことで何とかならないか,試行錯誤した結果を報告する.
第 2 章 SQL Server 2008 で空間データを実装する (Beginning Spatial with SQL Server 2008)
前章では,空間参照系の背後にある理論を紹介し,異なる種類のシステムが地球上の特徴を記述する方法を説明した.本章では,これらのシステムを適用して SQL Server 2008 における新しい空間データ型を使って空間情報を蓄積する方法を学んでもらう.
“第 2 章 SQL Server 2008 で空間データを実装する (Beginning Spatial with SQL Server 2008)” の続きを読む
環境省の捕獲鳥獣数の統計を折れ線グラフにする
また面倒な統計を見つけてしまった.Power Query に食わせれば早いのかも知れないが,どうにも埒が明かないので手動でデータを整形することになった.頼むから第一正規形で公開してくれ…
PowerPivotで100万件超えのデータを取り出す
EXCEL のワークシートの仕様上,100 万件を超えるデータは扱えない.これは大規模なデータを扱う際の制約である.180万件のデータをPower Queryで処理してEXCELがオーバーフローした話 でも述べたが,この制約を乗り越えてデータをインポートするにはデータモデルに読み込むほかはない.
SQL Server で PowerQuery が使えればこういった制約を回避できるのだが,ないものは仕方がない.今回は PowerPivot を用いてデータモデルに蓄積したデータを取り出す方法を見つけたので備忘録として記す.
全国の市区町村の財政
総務省の e-Stat から全国の市区町村の財政状況を垣間見る.衰退する都市には財政破綻の徴候が見られるはずである.今回は財政力指数,経常収支比率,実質公債費比率,地方債現在高に注目する.