ソースコードのアーカイブ Software Heritage archive


はじめに

サーフィンしてたら、Software Heritage archiveなるものがヒットした。
面白かったが情報が少なかったので、まとめる。

Software Heritage archiveってなに?

Software Heritageイニシアチブの長期的な目標は、すべての公開され入手可能なソフトウェアを開発の歴史とともにソースコードの形で収集し、それを必要とするすべての人に提供することである。(下記の拙訳)

The long term goal of the Software Heritage initiative is to collect all publicly available software in source code form together with its development history, replicate it massively to ensure its preservation, and share it with everyone who needs it.

by Welcome to the Software Heritage archive

だれがやってんの?

2017年4月3日に、ユネスコ(UNESCO)とフランス国立情報学自動制御研究所(INRIA)の間で、全てのソフトウェアのソースコードの収集・保存・アクセスのための基盤構築を目的に締結された連携協定によるもので、INRIAのプロジェクトSoftware Heritageで収集・保存されたソースコードを検索し、アクセスできるようになっています。

by Current Awareness

どのくらい登録されているの?

現時点でSource filesで5,638,701,567ファイル、Projectsで88,290,360プロジェクトが登録されている。

どんなコードが登録されてるの?

GitHub、debianやpythonから収集している。
筆者のポンコツプロジェクトまで収集しているので相当・・・。