交通計画とデータ分析は非常に親和性が高い分野です。
1.交通に関連するデータ
私が記憶している限り、平成2年に行われた全国道路・街路交通情勢調査は、オープンリールのテープに記録されていたと記憶しています。たった30年前まではこのようなコンピュータで処理されていたのだろうと思います。この頃からデータ分析によって、道路や空港、鉄道などは計画されていました。
この他にも、全国幹線旅客純流動調査、○○都市圏パーソントリップ調査など、数多くの調査が実施されてきました。
最近では、ETCがバージョンアップし、ETC2.0になりました。このETC2.0は皆さんの自動車についているあのカードを入れる機械に自動車のGPSデータや挙動データに記録し、道路脇にあるITSスポットに送られ、データサーバに蓄積されています。そのデータ量といえば、この30年で一体何倍、10の数乗倍になったことでしょう。また、自動車会社や交通アプリ会社、googleといったの民間企業でもデータを蓄積し、社会サービスに用いられています。
2.交通の基盤となるデータ
これらのデータを扱うには、一般財団法人デジタル道路地図協会が作成しているデジタル道路地図を使うと非常に便利にデータを分析できます。このほかにも、政府統計の総合窓口(e-Stat)にもバスや空港などのデータが公開されています。
3.データ分析の準備
データを分析するには、対象となるデータとその基盤のデータが必要になり、それらの準備が必要になります。ご紹介した交通計画で用いられているデータは、ご覧になられたように非常によく整備されている分野です。これらを使ってデータ分析しようとした場合には、分析する前に以下のようなことに留意が必要になります。
・仮説、分析方法、分析手順などの仕様
これがなければ始まりません。仮説を立て、手法を決め、手順を考えましょう。科学的=再現性です。
・データの種類
集めたデータ以外に必要なデータはありませんか?分析を始めた後にデータを探したり、新しいデータを使おうとすると、作業を始めからやり直す必要があります。
例:交通変動に関連した祝祭日などのカレンダー、気象などのデータは必要ないか
・データのボリューム
最近は、データのボリュームが非常に多くなっています。エクセルでは扱えないと思いましょう。処理時間を短くするために適切なデータのボリュームで作業しましょう。
例:入手できるデータは全国か、都道府県か、大規模都市圏を含んでいないか
・データ形式
複数のデータソースから集まるデータは、様々なデータ形式になっています。それを同じプラットホームで分析するのですから、個々のデータ形式には十分注意が必要です。
例:データベースは何を使っているのか、データ型は、テキスト、固定長や浮動小数。。。。
・データの整合性
集めたデータの時系列、地理、そもそもデータを取得したときの趣旨などの整合性がとれているでしょうか。計測器で観測されたようなデータは比較的整合させやすいですが、アンケート(表明選好データ)やバズの場合には非常に注意が必要です。
例:ODは全数データなのか、データの抽出率は何%か、速度の観測方法は光波か音波か。。
・テーブル定義
データを扱う場合には、テーブル定義は確認しましょう。親切な定義書には、データへの配慮、特にエラーや誤差に関する記載があります。
例:使いたいデータのほかに付属しているデータは何か?
このほかにも、留意することはたくさんあります。データになっているからといって、簡単にできると思うと、ほとんどの場合が苦労します。
オススメ記事
データ分析に関しては、下記より何でもお尋ねください。
※項目が6つありました。タイトるを変更させていただきました。10/5 19:00