科学的手法の基礎の1つは、結果の再現性です。 世界中の研究室で、研究者は他の科学者と同じ主題を研究して同じデータを再現するか、同じデータを分析して同じパターンに気付くことができるはずです。
これが、 Current Biologyで本日発表された研究の発見が非常に懸念される理由です。 1991年から2011年の間に公開された516の生物学的研究の著者に電子メールを送って生データを要求しようとした研究者グループは、最も古いデータの90%以上(20年以上前に書かれた論文から)アクセスできません。 合計で、2011年に発行されたばかりの論文を含めても、データを23%しか追跡できませんでした。
「誰もが、古い研究のデータを研究者に求めると、どこにあるのかわからないので、彼らは口を閉ざしていることを知っています」とブリティッシュコロンビア大学の動物学者であるティモシー・ヴァインズは言います。努力。 「しかし、著者が保持していたデータが実際にどれだけ早く消えるのかについて、体系的な推定はこれまでなかった。」
見積もりを行うために、彼のグループは、時間の経過とともに比較的一貫したデータの種類(植物や動物の解剖学的測定)を選択し、この種のデータを使用した期間中、奇数年ごとに25から40の論文を掘り下げました。彼らが生の数字を追い詰めることができれば。
驚くべき量の問い合わせは最初の段階で停止しました。調査の25%で、アクティブな電子メールアドレスが見つからず、ペーパー自体に無効なアドレスがリストされ、Web検索では現在のアドレスが表示されませんでした。 別の38%の研究では、彼らの質問は応答しなかった。 データセットのさらに7%が失われたか、アクセスできません。
「たとえば、場合によっては、3.5インチのフロッピーディスクに保存されていたため、適切なドライブがなくなったため誰もアクセスできませんでした」とVines氏は言います。 データを保持するという基本的な考え方は、将来の研究で他の人が使用できるようにするためであるため、この種の陳腐化は本質的にデータを役に立たなくします。
これらはありふれた障害のように見えるかもしれませんが、科学者は他の人と同じです-彼らは電子メールアドレスを変更し、異なるドライブで新しいコンピューターを取得し、ファイルのバックアップを失います-そのため、これらの傾向は科学における深刻で体系的な問題を反映しています。
また、データを保存することは非常に重要であり、覚えておく価値があります。これは、研究が将来どの方向に進むかを予測することができないからです。 例えば、Vinesは、交配の過程にあると思われる東ヨーロッパ原産のヒキガエル種のペアに関する彼自身の研究を行っています。 1980年代には、別の研究者チームが同じトピックに取り組んでおり、1930年代にこれらのヒキガエルの分布を文書化した古い論文に出会いました。 その分布が数十年にわたって比較的わずかしか変化していないことを知っていたため、科学者は他の方法では不可能だったあらゆる種類の計算を行うことができました。 「ポーランド語で書かれた非常に小さな古い研究から得られた元のデータは、70年後にやってきた研究者にとって非常に有用でした」と彼は言います。
また、この研究の大部分は公的資金で賄われているという事実もあり、その多くは、得られたデータを一般に自由に利用可能にすることを規定する助成金を通じてもたらされています。 さらに、フィールドデータは収集された環境の環境の影響を受けます。したがって、後で条件が変更されたときに完全に複製することはできません。
解決策は何ですか? Vinesが管理編集者であるMolecular Ecologyを含む一部のジャーナルは、著者が論文とともに生データを提出することを要求するポリシーを採用しており、ジャーナル自体が永久にデータをアーカイブできるようにしています。 ジャーナルは、人々と同様に、電子メールアドレスの変更や技術の陳腐化の影響を受けやすくなっていますが、これらの問題は組織規模ではるかに簡単に管理できます。