Французский институт исследований в информатике и автоматике INRIA (https://ru.wikipedia.org/wiki/INRIA), при поддержке правительства Франции, ввёл в строй (http://www.inria.fr/en/news/mediacentre/software-heritage-to... проект Software Heritage (https://www.softwareheritage.org/), задачей которого является сбор, сохранение и предоставление доступа к исходным текстам, собранным в одном месте из различных доступных источников. На базе Software Heritage создан крупнейший архив кода, ставящий перед собой задачу охватить все существующие открытые проекты и защитить доступный открытый код от возможной потери после закрытия сайтов проектов и репозиториев, а также дающий возможность организовать научные исследования над крупнейшей коллекцией кода.
В настоящий момент архив (https://www.softwareheritage.org/archive/) включает более 2.6 миллиарда файлов, охватывающих 23 миллиона открытых проектов и почти 600 млн коммитов. Архив включает код, размещённый в GitHub, в репозиториях Debian, коллекциях GNU и в других публичных архивах. Налажен процесс автоматической синхронизации изменений с GitHub, который скоро будет реализован и для других источников. Для запроса файлов пока можно использовать только контрольные суммы SHA-1.
Из планов на будущее отмечается расширение базы источников, реализация удобной навигации по коду и системы полнотекстового поиска, создание средств для отслеживания происхождения кода и цепочек заимствования, расширение метаданных и проведение статистических исследований, подготовка интерфейса для загрузки кода и истории изменений в форматах современных систем контроля версий.
URL: https://www.softwareheritage.org/2016/06/30/unveiling/
Новость: http://www.opennet.me/opennews/art.shtml?num=44711
Чтобы было натуральное наследие, надо все исходники перенести на глиняные таблички, а то какой-то ридонли гитхаб получается.
>глиняные табличкитеРРабайты
Гигатонны терабайтов.
У глиняных табличек плотность хранения маловата, лучше на фторопластовую перфоленту.
> У глиняных табличек плотность хранения маловата, лучше на фторопластовую перфоленту.легкий пожар и...
тогда чугуниевую
Один колоссальный датацентр с высокой надежностью хранения стоит в Гизе уже четыре с половиной тысячи лет. Правда, технологии считывания до наших времен, увы, не дошли...
>> У глиняных табличек плотность хранения маловата, лучше на фторопластовую перфоленту.
> легкий пожар и...Фторопласт не горит. Разве что расплавить можно..
А в клубок такую ленту можно замесить?
А при термическом разложении некоторых видов фторопласта выделяется очень токсичный газ.
>> а то какой-то ридонли гитхаб получается.Write-Only?
> Чтобы было натуральное наследие, надо все исходники перенести на глиняные табличкиВ Европе есть проект по переносу знаний на "топазные таблички". Между двух пластин топаза информация хранится в аналоговом виде и может быть прочтена с помощью простого в изготовлении аналогового проектора. Плотность довольно высокая. Картинки цветные. Гарантийный строк хранения не менее 1тыс лет. Стоимость одной "болванки" ~1000евро.
> Чтобы было натуральное наследие, надо все исходники перенести на глиняные табличкиЕсть M-Disk способен хранить информацию ~1000лет, читаться и пишется недорогими (обычными) DVD.
Есть кварцевые диски, способные хранить информацию миллиарды лет https://www.southampton.ac.uk/news/2016/02/5d-data-storage-u...
Сто тысяч миллионов файлов средним размером 60 килобайт... У них Штщву-ов не хватит.
Молодцы, французы, шарят. То золото заберут, то разживутся копией сорцов на собственных мощностях
information must be free!
Хочу торренты, чтобы у Я%@й пригорало.
Вот для начала:https://www.debian.org/CD/torrent-cd/
http://linuxtracker.org/
https://meta.wikimedia.org/wiki/Data_dump_torrents
http://www.kiwix.org/wiki/Content_in_all_languages/ru
https://wiki.openstreetmap.org/wiki/Planet.osm#BitTorrent
http://academictorrents.com/
> Хочу торренты, чтобы у Я%@й пригорало.Тебе не нравится пшеница?!
> нацелен на создание полного архива открытых исходных текстовОткрывай меня полностью.
http://www.opennet.me/search.shtml?words=%D0%CF...
"Кинутся тогда люди искать свои мебеля, а где они, мебеля? Вот они где! Здесь они! В шкафу. А кто сохранил, кто уберег? Коробейников. Вот господа спасибо и скажут старичку, помогут на старости лет… А мне много не нужно — по десяточке за ордерок подадут — и на том спасибо… А то иди попробуй, ищи ветра в поле. Без меня не найдут!" (с) Двенадцать стульев
"Создано централизованное хранилище".
- вот как я прочитал новость. А между тем шёл 2016 год.
Как ни крути - а это ещё один бэкап. Хотя если б они к своей копии дали какую-то возможность для желающих помочь - допустим, в виде торрентов - было бы хорошо, конечно.
Срезы архива будут?
А ведь точно! Как раз в соседней новости про DMCA http://www.opennet.me/opennews/art.shtml?num=44700 выяснилось, что свободный код безвозвратно удаляют. Интересно, они его успели заархивировать? Или они там архивируют только после цензуры?А вообще с историей всё выглядит печально: посмотрите на первые коммиты проектов: initial import from cvs. Один коммит! А в cvs же была целая история развития! Потеряна. Или они связываются с авторами на предмет, не сохранилась ли у них копия cvs? Вот это был бы действительно бесценный труд IT-археологов. Есть уже официально такая профессия?
Судя по тонким знатокам фекалий мамонта, все больше IT-палеонтологи.
Про CVS точно подмечено, я один раз пол дня искал откуда и зачем взялся этот код:https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux....
И уже никто даже не помнит для чего он там, но выпилить мейнтейнеры очень бояться, из-за того, что у кого-то что-нибудь сломается.
> Про CVS точно подмечено, я один раз пол дня искал откуда и
> зачем взялся этот код:
> https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux....
> И уже никто даже не помнит для чего он там, но выпилить
> мейнтейнеры очень бояться, из-за того, что у кого-то что-нибудь сломается.А комментировать код эти уeбaны так и не научились?
Сколько весит архивчик?
Фильтрация на индусокод будет?
Оно, насколько я понимаю, не о фильтрации, а ровно об обратном. Что лично мне больше всего и нравится.
клоун: Что тебе нравится? Наивно полагаешь, что если кто-то выложить сворованный код Windows под лицензией GPL, то они не удалят его, как на git/gibhub? Удалят. Незамедлительно. И ещё настучат на всех, кто поимел наглость его скачивать. И твои жалкие стоны про "не трожьте свободный код!" их не остановят. Он не свободный, он контрафактный.
Что там с виндовс-кодом и прочими испражнениями МС будет - вообще начхать, ибо даром не надо. А вот какие-нибудь результаты реверса, или методы джайлбрейка, или ещё что - могут иметь разный статус в разных юрисдикциях. Так что есть шансы, что хоть где-то, да выживет.
клоун: Мне бы твои детские наивность и незамутнённость... В единорогов и розовых пони тоже веришь? Ведь есть шансы что они уже прилетели и порхают за твоим окном. Сходи, глянь.
Это у тебя от страха клован, антидепресантов там попей каких. Скоро стипендии - конец, а кроме как *ать на форумах ты ничего не умеешь! Да ... ситуция! Запьёшь тут :(:)
> git/gibhub? Удалят. Незамедлительно. И ещё настучат на всех, кто поимел наглость
> его скачивать.У меня есть этот код где-то в бэкапах. Почему-то мне за это ничего не было. За все 16 лет которые он валялся. Настучи на меня, чтоли.
> их не остановят. Он не свободный, он контрафактный.Да, код нотпада даже комментировали на програмерских ресурсах. Там такой контрафакт что даже китайцы с их пластмассовыми "ифонами" отдыхают.
клоун: Зря так говоришь. В своё время я пытался повторить notepad и узнал ОЧЕНЬ много нового о его возможностях.А на бестолковом хабре часто постят и комментят всякую хрень, выдавая её за божественные откровения.
Молодцы. Хоть кто-то этим начал заниматься.>> при поддержке правительства Франции
Ну не Сколково же. У нас только подслушку инновационно обязать хранить в голову чиновника может прийти.
У нас write-only нанобэкап, это для кого надо бэкап.
ну это больше не чиновникам в голову пришло, а чекисткой опг защищающая "честно нажитое" . поездка на гелентвагенах чётко показывает менталитет чекистов и их детей закончивших академию фсб (организация пока ещё не запрещёная в России)
клоун: на важные события (выпускной, свадьба, юбилей, похороны) люди часто арендуют дорогой автомобиль, ресторан или номер в дорогой гостинице. И это ничего не показывает.Работа в разведке интересует далеко не всех, сидеть в родной стране на хлебной должности и выгоднее и проще. А после их акции ото всех опасных должностей их избавят. Увидишь завтра этих ребят руководящих контролем за хранением персональных данных (модная тема) - выгодно и не пыльно.
Хорошая новость. Конечно это должны были сделать французы, хорошо, что само правительство Франции взялось. Ведь Франция - сердце культуры. Посмотрите на список проектов inria.Если посмотреть кто автор CiteSeerX поисковика по научным работам, то это тоже француз, который, правда, перебрался для этого в Пенсильванию, штат, мотто которого "учить и обучать"
Конечно это стоило бы сделать раньше: archive.org например существует давно. Но сейчас уже просто необходимо: в свете того что деструкторы принялись уже и это уничтожать
Выше ДжОкерт шутит что собирать архивы сравнимо с работой старьевщика-коробейника, однако сорс-коды это другая материя, это даже не материя а явления из мира идей, и оно не гниет в этом смысле, а знания сохранить важно. (Когда говорят про "гниение кода" имеют ввиду, в организационном смысле, потерю уровня понимания работы кода в активном проекте. Соответственно неактивный проект гнить в организационном плане не может)