電子情報⇒情報工学科?(ビッグデータ活用)
今日は、福井県の情報システム工業会主催の講演会+懇親会があり、 参加してきました。以下に、その講演会で私の視点で気になった点をまとめてみました。
産業・地域の成長に向けたビッグデータの活用とその方策
「産業・地域の成長に向けたビッグデータの活用とその方策」というテーマで、 ビッグデータの特徴・定義という話題から、しくみ・構成要素という話題で、 講演が進みました。
簡単にまとめると、ビッグデータは様々な大量のデータをタイムリーに 扱うことが特徴。(ビッグデータの3V=Variety,Velocity,Volume) 今までのコンピュータは、構造化されたデータを処理するものであったが、 構造化されていないデータを扱うようになり、それを蓄積集計分析する時代 となってきた。これからは、データ活用は「現状分析」から『予測分析』 と変化していく。 だからこそ、データを科学的に分析するデータサイエンティストが 活躍する時代となる。
ビッグデータと周辺技術
ビッグデータは、 (1)対象からリアルタイムのモニタリングでデータを検索 できるようにしてきたが、 (2)それを蓄積加工するようになる。 この際いは、Key-Value な NoSQL に保存されていく。 (3)さらにデータを集計分析するために分析処理・並列分散処理 を行い、 (4)それがフィードバックされ新たな価値の創造が行われていく。
このビッグデータ活用サイクルでのキーワードをあげると、 データ収集(1)では、 M2M(Machine to Machine)=センサーデータ集約のためにデータ源の 機器が相互に情報交換するための手段。 蓄積加工(2)では、クラウドコンピューティングや、 DWH(Data Ware House)=データ倉庫。 集計分析(3)では、分散処理で Apache による Hadoop(大規模データの分散処理のためのJavaフレームワーク)や、 MapReduce(分散と集約で処理するプログラミングモデル)。 さらに、データの中に埋もれた関係性をみつけるためのマイニング、 特にテキストマイニングなども重要なキーワードであろう。
ビッグデータの活用ニーズ
現状では、情報検索サイトやマーケティングで活用が始まっている。 地方であれば、農業ICTとして農業のノウハウ確立・品質管理・生産管理 などが注目されるだろう。 一方で、エコマネージメントとして、家庭や企業の電力測定可視化といった 応用が進められるだろう。
データ=情報が重要になるのなら、電子情報は、本当の情報工学科に!?!?
このように、将来はビッグデータ活用がコンピュータ社会の中で 重要なキーワードとなるであろう。だからこそ大学・高専では、 ビッグデータを活用分析できるデータエンジニアが育つ必要がある。
ということで、福井高専の私たちの電子情報の将来像を考えてみると、 現状はオープンキャンパスをすると機械・電気電子・電子情報では、3学科そろって ロボット・ロボット・ロボットな状況。将来、少子化で学生数が減る際には、 学科の再編成の必要との意見も出ている。 この際には、電子情報工学科は、情報工学科となる可能性もあるだろう。 そうなってくると、今のうちからデータサイエンティストを育む カリキュラムや、MapReduceなどの分散処理指向のプログラミングスタイルを 教えるといった時代になっていくのであろう。 さらに(この講演では語られていないが)、データを活用するもう1つは、シミュレーション技術というのも、次世代に向けて重要視されていくだろう。