21世紀を変える数学の可能性 若山 正人 九州大学 理事・副学長 マス・フォア・インダストリ研究所 教授

professor's TALK

ビッグデータ時代の新しい数学―マス・フォア・インダストリの役割とは

これまで、多くの物理現象の理解には微分方程式が用いられてきました。しかしながら高性能コンピュータの出現で溢れるビッグデータの理解や応用には、微分方程式は不向き・不十分だろうと考えられます。では、統計学(や応用上欠かせない最適化技法)に加えて、ビッグデータを理解するための数学とは何か? その中心となるのは、おそらく図形の数学、幾何学です。

さて、与えられたビッグデータを分析する最初の手立ての一つは、似たもの同士をまとめるグループ分けでしょう。しかし、その似ているとか似ていないという根拠はどこに求めるのでしょうか?

分類には尺度が要りますね。物理学でも数学の大きな役割は、尺度にあたる保存量の記述でした。保存量を数学では不変量といったりします。20世紀以降の現代数学は、たとえばトポロジーのように、幾何学的対象である図形を抽象的にうまく捉える方法を発展させてきました。トポロジーでは、図形の穴の数に着目して大雑把に図形を見分けたりするわけですが、この穴の数というのも不変量です。

尺度の例をほかに挙げれば、癌の発生予兆診断に使うマーカーなどがあります。ビッグデータからの尺度の発見には、統計学であれば、データから、変数間などのある種の因果情報を推定することを手始めにするのがよいかもしれません。数学がなすべきは、データに基づいてモデルをたてると同時に尺度を発見し、さらにはそれらに必要な言葉の整備を行うことです。

そもそも、立ちはだかる難問に対して数学者が行うことの一つには「言葉の整備」(数学的自然に則った新しい概念の定式化)があります。たとえば、リーマン予想、あるいはそれと同値であることが知られている究極の素数の分布定理は、提出後150年以上経過してなお、多くの優れた数学者の攻略にもかかわらず未解決です。この“解けない”という状況に対して、少なからぬ数学者は、人類が有している言葉(概念)がまだ不足しているからではないか、と考えています。

実際、1994 年にアンドリュー・ワイルズ博士により解決されたフェルマー予想を振り返ってみても、そのことは理解できるように思います。フェルマー予想自体は、中学生でも容易に理解できるとても簡単な言葉で述べられていますが、大学の数学科で学ぶ数学の言葉・概念でも足りないくらい多くの最先端の概念を駆使して初めてその解決に至りました。もっとも、問題は容易かつ明確に述べ得ても解くのが難しいことは、どのような分野や物事でも同じであり、殊更強調すべきことではありませんけれど。

グループ分けの話に戻りましょう。数学においてもグループ分けは基本的で、「類別」という考え方があります。類別とは「AとBに関係があり、BとCにも関係があれば、AとCにも関係がある。そうであればAとBとCは同じものと見なそう」という考え方です。時計はこの類別を用いている最も身近な例です。時計の針は、昨日の3時から24時間経てば同じく3時を指しています。一日は24時間という不変量で同一視しているのですね。だからこそ容易に「明日の3時に待ち合わせしよう」と言えるのです。実際にもし、たとえばキリスト誕生からの時間で待ち合わせ時間を確認していたら、とても不便ですね。

もうひとつ、類別を利用した幾何学的な例としてドーナツの捉え方を示しましょう。いまX・Y座標によって表される2次元の平面があるとします。Y座標で1だけ違う点は全部同じものとみなす(仮想的にくっつける)ことにしましょう。そうすると横に無限に長いチューブができます。さらにX座標についても1だけ違う点は全て同じものとみなせば、ちょうどドーナツのような図形ができますね。このような考え方をすると、曲がっている図形であるドーナツ上の関数も、普通の平面上の関数として捉えられて便利です。以上のように、話をスッキリとさせるのにも、数学は役立ちます。

話は変わりますが、現在でもセキュリティの多くに使われているRSA暗号は、素数が無限個存在し、すべての整数は(順序を無視すれば)必ず素数の積にただ一通りの方法で分解できるという事実に基づいています。数をかけるのは簡単だが、素因数分解をするのは難しい、というのがその肝です。しかしこの事実が古代ギリシャ時代にピタゴラス学校で発見されて以来、社会への応用には2500年程度かかりました。

ピタゴラスといえば、2点間の距離を表す方法「a2乗プラスb2乗の平方根である」の発見もそうです。一方物理学では「a2乗プラスb2乗プラスc2乗マイナスt二乗の平方根である」を距離とする空間を考えます。実際、アインシュタインの特殊相対性理論とは、t を時間の変数と考えて、この距離をもとに打ち立てられた理論です。おなじみのE=mc^2(質量mの物体は、mに光速c(秒速30万km)の2乗をかけたエネルギーと同等である)は特殊相対性理論の帰結です。これは、たとえば、太陽の寿命を考えたり、ほぼ同じことですが核融合エネルギーを見積もったりするなど、核物理学などの分野で大変重要ですが、このような曲がった空間の幾何学(非ユークリッド幾何学といいます)もそれ以前に数学者により発見され研究されていたのでした。そこでも、元々はピタゴラスによって発見されていた普通の距離と同様に、その距離を保つ変換で不変な物理法則を考えるというのが出発点になっています。光速度不変の原理もそこから導かれるものです。

このように、現在は役に立つかわからない純粋数学が何百年も経てとても大きな役割を担うようになっているかもしれません。私は九州大学マス・フォア・インダストリ研究所というところに所属していますが、このマス・フォア・インダストリを直訳すれば産業数学です。したがって「(現在の)産業における数学」という意味ならば、マスマティクス・イン・インダストリとするのが国際的には普通です。しかしそこには、現在の産業への応用・問題解決を目指すことはもちろんですが、それだけではなく、将来生まれるだろう産業のために、という意味が込められています。

先に述べたように、今ある産業から得られるビッグデータを対象とすることによってさえ、今はまだない新しい数学の言葉、記述の仕方が発見できるかもしれません。さらにその数学は将来の産業にとって大きな役割を担うことができるかもしれません。また、たとえば数学は人工知能(AI)が理解する最も適した言語を提供するでしょうから、AIと数学の融合は、今後22世紀への超スマート社会には不可欠なものとなるでしょう。このような数学の大きな可能性を拓くことが、マス・フォア・インダストリの大きな目的なのです。

SCHOLAR講師

Pagetop