いわゆる市区町村コード(2)¶
(承前)
データとしての使いやすさと情報量という点では、 統計LOD から公開されている「標準地域コード」で充分である。 ただ、実際に中身を見たところ、やや不十分なところがあった。
自治体の分割に対応していない。山梨県上九一色村が2分割されて 甲府市と富士河口湖町に編入されたケースなどが正確に記述されていない。
標準地域コード策定時点(1970年4月1日)時点で既に廃止されていた自治体の エンティティが混入していて紛らわしい。
これについては統計LODの問い合わせアドレスにメールで問い合わせたところ、 データを修正する方向で対応する、とのことであった。 そのうちデータがアップデートされるものと思われる。
さて LOD と言えば Sparql とかいう言語で検索したりするものらしいが、
私は当面は自発的にこれを学ぶつもりはない(だってめんどくさそうだし)。
この程度のデータ量だったらどんな方法でも大差はないのだから、
いつも通りに Python + rdflib で スクリプト
を書いてみた。
各コードの有効期間と編入・合併先を抽出するスクリプトである。
実行結果は こんな感じ
(ただし別途 sort してある)。
元データのライセンスが CC-BY 4.0 なので、このファイルを利用する場合は
元データの権利者を表示すること。
ただし標準地域コードの著作権者が誰になるのか、統計LODのサイトに
記載が無い...(追記・「政府統計の総合窓口(e-Stat)」で良いそうだ)。
前の投稿:
Python で MS Access データファイルを読む
次の投稿:
いわゆる市区町村コードなるもの