エンジニアリングとお金の話

都内で働くエンジニアの日記です。

【技術】Webスクレイピング勉強会に行ってきた

【SPONSORED LINK】

以前から参加してみたいと思っていたWebスクレイピング勉強会に参加してきた。なお、今回が最終回だった模様。

第3回Webスクレイピング勉強会@東京(最終回) - connpass

感想としては、非常に濃い内容の話が聞けて大変勉強となった。匿名でクローリングする方法やAWSを活用したクローリング方法等、実践で役立つ手法を色々と理解する事が出来た。また、エクセルを用いたスクレイピング方法ではWEBクエリーなる機能を活用する方法が紹介され、確かにそんな機能あったなと再発見させられた。

新しいワードとして、データジャーナリズムなる言葉も理解する事が出来た。データジャーナリズムとは、データを起点にニュースを発見しわかりやすく伝える手段とのこと。データを活用する事により多様な表現方法や低コストでの世論調査等が行える様になり、今までなかった観点からの報道が可能となったらしい。

なお、データジャーナリズムを行うにあたり特定のグループの中から必要なデータを取得する仕組みがあればお金になるのではとの話があった。例を挙げると地方議会等の情報は各地方のWEBサイトにアップロードされるが各々フォーマットが異なる為、収集するのが難しいとのこと。確かに、一律で情報取得出来る仕組みがあれば便利だと思うので、自分も何か貢献出来るように開発を行っていきたいと思った。

クローリングもスクレイピングもまだ初心者の域を達していないので、これからもっと知識を付けていく様にしたい。