PyData Tokyoの勉強会が昨日開催されたので参加してきた。本当は抽選に漏れて参加出来ないはずだったが運よく繰り上がる事が出来た。多分台風の影響だろう。Goodjob!
勉強会の内容としては位置情報データを扱う上での注意や手法等についての説明で位置情報データを全然理解していない自分でも楽しく学ぶ事が出来た。色々な話を聞く事が出来たがその中で印象に残った事をメモしておく。
学んだこと
地図については座標系の違いにより、同じ緯度・経度でも表示が異なる。日本では主に日本測地系、世界測地系、旧日本測地系が使用されている。
位置情報を経度、緯度に変換する事をジオコーディングと言う。現在はゼンリンが提供しているデータを用いて変換している。オープン化の動きもあるがまだ道半ばな感じ。オープンな情報を使用する際は、オープンスイートマップ、cloudmade、geofabrik等がある。
電話帳データはかなり高い。普通に購入すると一億程掛かる。
pythonでジオデータを扱う時に便利なライブラリ
geopandas
※こんな事が出来るらしい⇒sinhrks.hatenablog.com
pyproj
※こんな事が出来るらしい⇒qiita.com
地理情報系のサービスは大半がpythonで出来ている。
お勧めの本
- 作者: 厳網林
- 出版社/メーカー: 日科技連出版社
- 発売日: 2003/04
- メディア: 単行本
- この商品を含むブログ (1件) を見る
- 作者: 張長平
- 出版社/メーカー: 古今書院
- 発売日: 2009/07
- メディア: 単行本
- クリック: 2回
- この商品を含むブログを見る
地理情報をDBで対処したい場合はPostgreSQLがライブラリがそろっているので便利。
今回の発表者仙石さんが作成したWebAPIが便利そう。
色々な話を聞く事が出来たが一番印象に残ったのは、航空写真から世帯数を算出する為に取った方法である。過去何年かの画像データから地区年数や住居の間取り等を算出し、国土地理院が提供したデータと当てはめる事でその地域に住んでいるおおよその人数や年齢層が分かるとの事。気の遠くなる作業だが機械学習やディープラーニングを活用すればこんな事も出来る様になるんだと感動した。
地理情報はまだあまり存在しない為、力技で集める必要があり活用するには中々大変と言える。ただ、今後自動運転やドローン等が活躍する上で必要不可欠なデータと言えるので成長が期待出来る分野では無いかと思う。技術的にも投資的にも面白くなりそうな分野なので今後も動向を注意して行きたい。