https://frosthead.com

これは世界最大の家系図かもしれません

23andmeのようなサービスによるDNA検査の増加は、家族の歴史に大きな市場があることを示しています。

現在、科学者は、世界最大の家系図データベースであると信じているものを公開することにより、そのデータを基に構築し、1300万人を結び付け、5世紀以上遡る家系図を作成しました。

Jocelyn KaiserがScience誌に報告しているように、コロンビア大学の計算遺伝学者であるYaniv Erlichは、家族関係を検索する多くのサイトの1つであるGeni.comから遠い親coからメールを受け取った後、7年前にプロジェクトを考え出しました。

Gemi.comの最高技術責任者の支援を受けて、Erlichはサイトの公開プロファイル(数千万)をダウンロードしました。 DNAデータは提供しませんでしたが、情報には人の名前、性別、生年月日、生年月日、死亡日、近親者が含まれていました。

Natureは2013年に初期段階でErlichのプロジェクトについて書きました。昨年、 大西洋のSarah Zhangは、研究者が巨大な木のプレプリントをリリースしたと報告しました。 現在、Kaiser氏は、ErlichのチームがScience誌に彼らの研究に関する研究を発表したと書いています。 そのデータを使用して、彼らは530万本の木になりました。その最大のものは、ほとんどがヨーロッパ系の約1300万人の親connectsをつないでいます。

プロジェクトの開始以来、ErlichはGeni.comを所有する家系図およびDNAテスト会社であるMyHeritageの最高科学責任者になりました。 彼は先週の金曜日に彼の発見についてReddit Ask Me Anythingを行い、誤解を修正し、プロジェクトの背後にある方法論を説明しました。 彼はまた、彼にとって経験の中で最も興味深い部分は、利用可能なデータをすべて個人的なものに変換する方法を見つけ出すことであると述べました。

National GeographicのNicole Wetsmanのインタビューで、Erlichは、そのデータを処理する方法を見つけることもプロジェクトの最も困難な部分であると述べています。 「ゲノムデータセットには、特定のツール、データ構造、メソッドがありますが、これには何もありませんでした。 私たちは行ったときに車輪を発明していました」と彼は言います。

最終的に、研究者は数学グラフ理論を使用して情報を整理および検証しました、とライブサイエンスのローラゲッゲルは報告しています。 彼らはまた、プロファイルをGeni.comにアップロードされた裕福なプロファイルだけではないことを確認するために、25年間にわたってバーモントから公開された約80, 000の死亡証明書とプロファイルを比較しました。

次に、チームはデータベースをテストするためにどの情報を検索するかを決定しました、とWetsmanは書いています。

彼らはパターンを見始め、寿命の変動を発見しました。 たとえば、彼らは南北戦争と第一次世界大戦と第二次世界大戦中に若者の数が減少し、1900年代に幼少期の生存率が上昇したのを見ました。 彼らは、1620年に現在のマサチューセッツ州にメイフラワーが到着し、その後その地域で出産が増加したように、移住を追跡することもできました。

研究者はまた、長寿は遺伝学よりも環境と行動に関係していることを発見しました。 実際、データによると、遺伝子が寿命の原因となるのはわずか16パーセントです。 しかし、ボストン大学公衆衛生学部の生物統計学の教授であるパオラ・セバスティアーニは、ウェッツマンとのインタビューでこのデータに関する結論を引き出すよう警告しています。 「長寿の定義には多くの混乱があります」と彼女は言います。

オーストラリアのブリスベンにあるクイーンズランド大学の遺伝学者ピーター・ヴィッシャーは、データが健康情報にリンクされている場合、病気に関する遺伝学の役割に関する洞察を提供する可能性があるデータをカイザーに伝えます。

研究チームはすでにツリーをDNA.Landからの情報と結合し始めています。DNA.LandはDNAデータをクラウドソーシングしているため、さらに大きなツリーが間もなく登場する可能性があります。 研究者は、データベースが65世代前に戻ることができれば、ツリーを完成できると予測しています。

これは世界最大の家系図かもしれません