エビデンスで教育を考えた

頭が良くなる科学論文を紹介していきます。

データサイエンスの歴史を振り返ろう①概略編

 2003年にデータの洪水という言葉が使われてから早20年。
そろそろデータサイエンスの知見が溜まってきたので(人類的に)、ここいらで歴史を振り返りたいなと。

というのも、私自身がデータサイエンスの世界に放り出された身なので、データサイエンスがどのように発展していったのかがいまいちわからないまま徒手空拳でやってるというのがありまして笑。何が幹で何が枝葉なのかを整理したんですよね。

というわけで今回はデータサイエンスの歴史の話。(いつものように加筆予定です。)

概略編

「データサイエンス」という言葉が使われたのは1974年のナウアさんの著書が初。[ナウル 1974]

ここでの定義はデータを扱う科学としてデータサイエンスという言葉を使ったみたいです。意外に古いですね。もちろんこの頃にはまだpythonもなければディープ君もない時代。その意味でこの著書はほぼほぼ予見みたいな立ち位置だったものと思われます。

 時を同じくして使われていたのはデータ処理や探索的データ解析という言葉。データ処理は1968年[Morrell 1968]で探索的データ解析は[Tukey 1977]に使われております。
 探索的データ解析はいわゆるEDAというやつでして、データサイエンスをする際にはデータ理解をしたり分析方針を決めるための大事なステップの1つ。当時はデータ理解というより、もっと踏み込んでデータから新しい知識を発見しようという意味合いの方が強かったみたい。ここからデータマイニングなんという言葉が出てきて今日のデータ分析(データアナリシス)に結びついているんすね。

(続く。)
※薬が切れて花粉症が再発しました。結果寝不足になりうまく書けない日々が続いてます。続きは必ず書きます!