https://frosthead.com

ヒトゲノムの人工知能研究により未知のヒト祖先が発見される

機械の心は、人間であることの意味について新しいことを教えてくれますか? 私たちの種の複雑な起源と進化に関する複雑な話になると、それができるように見えます。

最近の研究では、機械学習技術を使用して、人間の起源と進化の8つの主要なモデルを分析し、プログラムは、人間の祖先の「ゴースト集団」の人間のゲノムの証拠を特定しました。 この分析は、人類進化史の長く曲がりくねった道に沿って、これまで未知で長く絶滅したヒト族のグループがアジアとオセアニアのホモサピエンスと交配し、現代の人間のDNAに断片化された痕跡のみを残したことを示唆しています。

Nature Communicationsに掲載されたこの研究は、機械学習が私たち自身の起源の手がかりを明らかにするのに役立つ最初の例の1つです。 化石化した骨に残された膨大な量のゲノムデータを熟読し、現代の人間のDNAと比較することで、科学者は種の進化史のギャップを埋めることができます。

この場合、結果は、地上で見つかった人間の祖先の化石の研究から開発された古人類学の理論と一致するようです。 新しいデータは、神秘的なホミニンがネアンデルタール人とデニソワ人の混合物に由来する可能性が高いことを示唆しています(ネアンデルタール人とデニソバン人は2010年に人間の家系図で唯一の種として同定されました)。 私たちの進化の過去のそのような種は、シベリアのデニソワ洞窟からの90, 000歳の10代の少女の化石によく似ています。 彼女の遺体は、去年の夏、ネアンデルタール人の母親とデニソワ人の父親を持つ、2種の第1世代ハイブリッドの唯一の既知の例として説明されました。

「これはまさにこの集団の起源で見つけることが期待される種類の個人ですが、これはただの個人ではなく全集団であるべきです」と、バルセロナのポンペウファブラ大学の進化生物学者である研究の共著者であるJaume Bertranpetit氏は言います。

属ホモの広がり 初期の人間が変化する条件に適応する能力により、 ホモの初期種は最終的に変化し、生存し、185万年前にアフリカからユーラシアに広がり始めました。 (画像提供:Antón、Potts and Aiello(2014)、Science 345(6192))

以前のヒトゲノム研究は、おそらく18万年前に現代人がアフリカを去った後、絶滅する前に初期の現代人と共存していたネアンデルタール人やデニソワ人のような種とその後交雑したことを明らかにしました。 しかし、これらの分岐した枝を含めるために家系図を再描画することは困難でした。 「ゴースト」種の証拠はまばらである可能性があり、 Homo sapiensが他の種と交雑した時期、場所、頻度を説明する多くの競合理論が存在します。

遺伝子移入と呼ばれるこれらの古代の種間連絡の痕跡は、ヒトゲノムの発散の場所として特定することができます。 科学者は、両方の染色体が同じ人間の種に由来する場合、予想よりも2つの染色体間の分離が大きいことを観察します。 2010年に科学者がネアンデルタール人のゲノムを配列決定したとき、彼らはこれらの分岐の一部がネアンデルタール人から来た私たちのゲノムの一部を表していることに気づきました。 研究では、生きている人間の中には、祖先の5%をデニソバンにまで遡ることができるものもあることが明らかになっています。

「それで、我々は、ゲノム内のこれらの高い分岐の場所を見つけ、ネアンデルタールとデニソバンであり、これらが全体像を説明するかどうかを見ようと思ったと思います」とBertranpetitは言います。 「たまたま、ネアンデルタール人とデニソワ人の部分を差し引くと、ゲノムには非常に発散した何かがまだあります。」

ゲノム全体のさまざまな場所を特定して分析し、それらを生み出した無数の遺伝的組み合わせを計算することは、人間が自分で取り組むには大きすぎる仕事ですが、それはディープラーニングアルゴリズムに合わせて調整する作業です。

ディープラーニングは、アルゴリズムが人工ニューラルネットワーク、または哺乳類の脳と同じように情報を処理できるプログラムとして機能するように設計された一種の人工知能です。 これらの機械学習システムは、パターンを検出し、以前の情報を考慮して「学習」し、膨大な量のデータを分析した後に新しいタスクを実行したり、新しい情報を検索したりできます。 (一般的な例は、Google DeepMindのAlphaZeroで、ボードゲームをマスターすることを習得できます。)

「ディープラーニングは、より複雑な形状のものをより大きな空間の一連のポイントに適合させることです」と、テンプル大学の進化ゲノミクスの専門家であるジョシュア・シュライバーは言います。 「YとXの間に線を当てるのではなく、はるかに大きい、千次元の空間の点のセットに波線のようなものを当てはめています。 ディープラーニングでは、「これらのポイントにどの波型が適合するのかはわかりませんが、何が起こるか見てみましょう。」

この場合、私たちのDNAが古代の進化の何千もの可能なシナリオでどのように進化したかをシミュレートすることによって、人間のゲノムを分析し、人間の人口統計を予測するように機械が設定されました。 このプログラムは、DNAの構造と進化、および人間の移動と交配のモデルを考慮して、いくつかのピースを信じられないほど複雑なパズルに収めようとしました。

研究者たちは、ユーラシア全域の初期の人間の進化のもっともらしい理論の8つの異なるモデルを分析するようにコンピューターを訓練しました。 モデルは、既知のネアンデルタールおよびデニソバン成分を含む、ヒトゲノムの現在の状況をもたらすシナリオを考え出そうとした以前の研究から生まれました。

「もちろん、他のモデルもありますが、これらのモデルは、他の人々が科学文献で提案しているものです」と、Bertranpetit氏は言います。 各モデルは、受け入れられたアフリカ以外のイベントで始まり、既知の種と可能性のある「ゴースト」種の両方のさまざまな交配を含む、人間の系統間の最も可能性の高い分割の異なるセットを特徴としています。

人間の家系図 ヒト、またはホモサピエンスはアルディピテクス属、 アウストラロピテクス属、およびパラントロプス属の種を含む、直立した歩行先祖の複雑な木から派生しています。 (スミソニアンの人間起源プログラム)

「これらの8つのモデルのそれぞれで、実際の現在の人間の遺伝子構成にどれだけうまく到達できるかを、数週間にわたって計算します」とBertranpetit氏は言います。 「私たちがシミュレーションを行うたびに、それは人間の進化の可能な経路のシミュレーションであり、私たちはそれらのシミュレーションを何千回も実行しました。ディープラーニングアルゴリズムは、どのモデルがデータに最も適しているかを認識できます。」

マシンの結論は? 祖先種は、私たちがまだ特定していない系統に存在します。 「これまでのところ、データに実際に裏付けられているテスト済みのモデルは、このゴースト集団に遺伝子移入されているモデルだけです」とBertranpetit氏は言います。

興味深い研究などは、ユーラシアとオセアニアのますます複雑になっている古代世界のように見えるものの、人間がどのように移動し進化したかを示す地図を描き直すのに役立つかもしれません。

「これは確かに興味深いものであり、人間の進化における複雑な網状系統発生の新たな状況と一致しています」と、ペンシルベニア大学の人口遺伝学者であるIain Mathiesonは電子メールで述べています。 「それが標準であると思われる場合、「遺伝子移入イベント」について話をするのが理にかなっているとさえ確信していません。」実際、テストされたモデルは8つだけであり、他の多くのモデルが可能であるため、マシーソンは新しい発見は確かにもっともらしいシナリオですが、現実はさらに複雑です。」

この分野で新しい化石の発見が行われると、これらのタイプのプログラムを使用して、更新されたモデルをヒトゲノムに対してテストできるようになりました。 シュレイバーは、人間の起源を研究するための深層学習の力は、複雑なモデルを分析する能力に正確にあると言います。

「あなたが人類学者であるために非常に詳細なモデルを作成したい場合、そしてこの遺伝子移入が80, 000年前に起こったのか、40, 000年前に起こったのかを知りたいのであれば、それはこのようなディープラーニングアプローチの力です」

複雑ですが、古代ユーラシアの交配は、私たちの人間の物語の一部にすぎません。 Bertranpetitは、ディープラーニングの将来の進歩が他の新しい章の発見に役立つと考えています。

「この種の分析方法は、あらゆる種類の新しい結果をもたらすでしょう」と彼は言います。 「アフリカで働く人々は、まだ認識されていない絶滅したグループを見つけるだろうと確信しています。 アフリカは、将来、驚くべきことを見せてくれることは間違いありません。」

ヒトゲノムの人工知能研究により未知のヒト祖先が発見される