Programa de Archivos de Código Abierto

GitHub expande su Programa de Archivos de Código Abierto

Las futuras generaciones de desarrolladores podrán visualizar las primeras líneas de código abierto de Linux, Ruby o Python.

El Programa de Archivos de GitHub busca preservar software de código abierto históricamente relevante. La idea es permitir a los futuros desarrolladores de software ver cómo la comunidad construyó y analizó el código.

El programa de archivos de GitHub se expanderá para incluir como parte del almacenamiento  a tres bibliotecas históricas en Oxford, Egipto y California. Cada una, además de la sede de la empresa en California, tendrá copias impresas de los desarrollos más importantes en código abierto.

La compañía, adquirida  por Microsoft en 2018, espera preservar los tendencias del software de código abierto para las generaciones futuras. El programa lo lleva a cabo en asociación con la Fundación Long Now, el Archivo de Internet, la Fundación del Patrimonio de Software, el Archivo del Mundo Ártico y Microsoft Research.

¿Qué es el Programa de Archivos de GitHub?

El Programa busca conservar para la posteridad 186 carretes de piqlFilm y 21 TB de datos

El programa de develó el año pasado en el evento Universe de la compañía de gestión de códigos. El Programa de Archivos de GitHub tiene como objetivo preservar el software de código abierto. Este tratamiento del software de código abierto es similar a lo que hacemos con las obras de arte, el diseño o la literatura.

Creemos que vale la pena preservar el software y la forma en que las personas trabajaron juntas en todo el mundo para contribuir y revisar el código fuente. Hay algo culturalmente que vale la pena preservar“, agregó Dohmke de GitHub, vicepresidente de programas estratégicos de GitHub.

La misión de este programa  busca preservar tanto las versiones “cálidas” como las “frías” del código. Con esto se asegura la conservación de múltiples copias y formatos del software. Esto es conocido como el enfoque “LOCKSS” por los archiveros, o Lots Of Copies Keeps Stuff Safe.

Este programa incluye el almacenamiento de un archivo de códigos en el Archivo Mundial del Ártico en Svalbard, Noruega. El lugar donde se almacenarán los archivos queda menos de dos kilómetros de distancia del Banco Mundial de Semillas. Allí se ingresarán para la posteridad 186 carretes de piqlFilm y 21 TB de datos.  Dicho depósito es una una mina de carbón desmantelada de 250 metros de profundidad en el permafrost del círculo polar ártico.

El archivo se está construyendo para dos tipos de personas, según Dohmke, “los historiadores y los futuros desarrolladores de software que sienten curiosidad por saber cómo se desarrolló el software durante esta época”.

GitHub expande el Programa de Archivos de Código Abierto

Pero además de un archivo digital, la expansión del Programa de Archivos de Github implca la impresión adicional de los repositorios de código abierto históricamente relevantes en bobinas de piqlFilm.

Ahora, el proyecto se está expandiendo mediante la donación de carretes de microfilm endurecido a la Biblioteca Bodleian de 400 años de antigüedad de la Universidad de Oxford en Inglaterra; la Biblioteca de Alejandría en Egipto, y las Bibliotecas de Stanford en California; así como el almacenamiento de una copia en la biblioteca de la sede de GitHub en San Francisco.

Cada donación está especialmente encapsulada usando una combinación de impresión 3D y arte generado por la IA por el ingeniero y artista Alex Maki-Jokela.

Preservar las estrellas de GitHub

Adicionalmente, el Programa de Archivos de GitHub incluirá sus repositorios más populares por el número de “estrellas” dadas por la comunidad.  Incluyendo proyectos como Linux y Android y lenguajes de programación como Ruby y Go. La compañía también está preservando cinco mil repositorios elegidos al azar.

La idea detrás de esto es que cuando uno se remonta a la historia queremos preservar el trabajo de desarrolladores individuales, estudiantes y pequeños desarrolladores menos conocidos y sus proyectos de código abierto“, dijo Thomas Dohmke, vicepresidente de programas estratégicos de GitHub.

Por su propia naturaleza, el software de código abierto no es algo estático que deba ser preservado, es colaborativo y siempre está en flujo. La intención no es almacenar copias que puedan ser arrancadas y ejecutadas en el futuro, aunque eso puede ser posible. En cambio, la idea es preservar un momento en el tiempo, en el que el código abierto se convirtió en el principal modo de desarrollo de software, y trazar el significado cultural de ese movimiento.

 

Todo el código archivado también incluirá guías técnicas para la decodificación QR, formatos de archivo, codificación de caracteres y otros metadatos críticos para que los futuros desarrolladores puedan decodificarlo. “El almacenamiento no es lo mismo que la preservación, tienes que hacer otras cosas”, dijo Ovenden.