eStatから国勢調査の小地域の境界データをダウンロードしSQL Serverにアップロードするではポリゴンを含むデータを SQL Server にアップロードするまでの記事を記した.今回はそのテーブル内に記録された経度,緯度から Point ジオメトリを生成する.第 6 章 空間データをインポートする (Beginning Spatial with SQL Server 2008)に倣っている.
都道府県別の納税義務者数と課税対象所得の推移を散布図に示す
eStatには納税義務者数(所得割)と課税対象所得のデータが1985年から2020年まである.今回は都道府県別の自治体ごとの納税義務者数と課税対象所得の散布図を示す.
QGIS でジオメトリを修復する
国土数値情報の河川データにはテーブル構造の不一致の他にも不具合がある.具体的には,LineString ジオメトリは 2 個以上の Point を必要とするが,特定の県のデータには Point が 1 個しかないジオメトリが複数ある.
国土地理院の基盤地図情報ダウンロードサービスのファイル名を調べる
国土地理院の基盤地図情報はあらゆる日本地図の基礎となっている.ダウンロードしたファイル名に一定の規則があり,何を示したものか調べた.
Ecorisで国土地理院基盤地図情報の数値標高モデルをGeoTiffに変換する
国土地理院の基盤地図情報ダウンロードサービスではベクタデータとラスタデータをダウンロードできる.Point, LineString, Polygon はベクタデータだが,数値標高モデルはラスタデータである.今回はラスタデータである数値標高モデルをダウンロードし,GeoTiff に変換する.
国土数値情報の河川データをダウンロードして SQL Server 2008 R2 にアップロードできなかった話
行政区域データは Polygon であったが,河川データは Line と Point である.河川端点を表現するのに Point が使われている.
“国土数値情報の河川データをダウンロードして SQL Server 2008 R2 にアップロードできなかった話” の続きを読む
第 2 章 SQL Server 2008 で空間データを実装する (Beginning Spatial with SQL Server 2008)
前章では,空間参照系の背後にある理論を紹介し,異なる種類のシステムが地球上の特徴を記述する方法を説明した.本章では,これらのシステムを適用して SQL Server 2008 における新しい空間データ型を使って空間情報を蓄積する方法を学んでもらう.
“第 2 章 SQL Server 2008 で空間データを実装する (Beginning Spatial with SQL Server 2008)” の続きを読む
厚労省「地域ごとのまん延の状況に関する指標等」の PDF から Power BI Desktop でデータを抽出し EXCEL のグラフに表現する
新型コロナウイルスのパンデミック宣言以降,Twitter でフォローしているアカウントに自然と相互協調の動きがみられる.
厚労省が「地域ごとのまん延の状況に関する指標等」の公表を開始。
— にゃんこそば (@ShinagawaJP) 2020年4月23日
都道府県ごとの①確定患者数、②リンクが不明な患者数、③相談件数、④PCR検査の実施数…と、必要な情報を一通り網羅しています。
が、ファイルはまさかのPDF形式。ExcelかCSVも提供してくれれば…https://t.co/Ox5rU6m1Xo
このツイートから始まった一連のやりとりで,厚労省の発表した PDF からテーブルを抽出するくだりに注目した.
失礼します。今、マクロソフト Power BI デスクトップを使用したところ無事PDFを読み込めました。また、列のピボット解除という機能を使うことで、クロス集計表を添付のような集計用フォーマットに加工できます。 pic.twitter.com/FEV0SBSito
— Akira Takao (@modernexcel7) 2020年4月23日
今回はここを画像つきで実施してみた.
“厚労省「地域ごとのまん延の状況に関する指標等」の PDF から Power BI Desktop でデータを抽出し EXCEL のグラフに表現する” の続きを読む
環境省の捕獲鳥獣数の統計を折れ線グラフにする
また面倒な統計を見つけてしまった.Power Query に食わせれば早いのかも知れないが,どうにも埒が明かないので手動でデータを整形することになった.頼むから第一正規形で公開してくれ…
EXCEL VBA で Series オブジェクトをソートできなかった話
Series オブジェクトを PlotOrder プロパティでソートする必要があった話をした.今回,Series オブジェクトをソートするために Collection オブジェクトに代入したのだが,配列の最終要素を取得するところで実行時エラーとなり,解決していない.
Series オブジェクトをソートするための方法としては,元のデータで比較する方法と,Series オブジェクトの最終 Point オブジェクトの Top プロパティを比較する方法がある.
意味としてはどちらも同じだが,どうせなら元のデータで比較するのが王道と思われたのでそちらを試したのだが,今の自分にはスキル不足で手に負えなかった.悔しい.