データサイエンスの将来性に疑問

最近デジタル機器の増加に伴ってデジタルデータが膨大となり、これを加工・分析できる専門家の需要増加が見込まれることから、大学でデータサイエンスという名の付く学部または学科の開設が相次いでいます。滋賀大学を嚆矢として横浜市立大学、立正大学、武蔵野大学、中央大学、大阪工業大学などで開設済みであり、今後一橋大学や富山県立大学などで開設が計画されています。この他データサイエンス学部や学科とは名乗っていなくともデータサイエンスの専門家を養成する学部や学科が多数出来ている、または計画されているようです。

しかし私はこれらの学部や学科で養成される専門家が従事するだけの仕事があるのか疑問に思っています。確かにデジタルデータは増えていますし、今度IoTの進展に伴ってデジタルデータが爆発的に増えることは事実です。しかしこれらの膨大なデータ(ビッグデータ)を詳細に分析して経済的効果を出せるのか疑問があります。実際ビッグデータを分析して生まれた製品やサービスの成功例は無いように思われます。

私が一番危惧するのはビッグデータの信憑性です。どんなに専門家にスキルがあってもデータの質が不十分なら有効な分析結果が出てきません。日本のデータは信憑性が低いと言われており、日本に進出している外資系の企業では眉唾物として扱われているようです。政府の統計でも厚生労働省や国土交通省で不正が明らかになっており、これは氷山の一角と思われます。統計業務は現場から上がってくるデータの集計業務と見做されており、官庁や企業においても非専門的な仕事となっています。そのため個々の統計データが検証されておらず、その結果集計されたデータは目安くらいにしか考えられていません。これのデータを分析しても有効な意味を引き出せるはずがありません。

データ分析の専門家(データサイエンティスト)が現在活躍しているのは、薬の臨床試験の分析においてではないかと思います。この分析では1件1件のデータが吟味された上で、分析結果については研究者が寄ってたかって吟味しますので、信頼性が大変高くなっています。それに分析結果により有効性が認められれば巨大な利益を生みますので、データサイエンスティストの位置付けも高くなっています。正直今データサイエンティストが評価されている業務はこれくらいしか浮かびません。これについては京都大学大学院医学研究科に臨床統計家養成コースがあるようです。これを知るとデータサイエンティストにはデータの出所である業務の専門知識が不可欠であり、データサイエンティストは業務ごとに求められるように思われます。果たして現在増加しているデータサイエンスコースがここまで意識して教育プログラムが作られているか疑問があるところです。だから私はデータサイエンスには懐疑的です。