| 
|  | |  | |  | |  | |  | |  | | 7.41, Yuris (??), 09:42, 02/09/2016 [^] [^^] [^^^] [ответить] | +1 +/– |  |  Вы нас плавно подводите к тому, что Фэйсбук проект ЦРУ? ;) 
 |  |  | 
 | 
 | 6.51, Аноним (-), 16:39, 03/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | > Не-не-не. Они изобрели скруглённые углы. Вы будете ржать, но автор сабжа учился на маркетолога. Но в какой-то момент решил что труба шатал углы закруглять. И занялся сжатием. Преуспев в этом получше многих других.
 |  |  | 
 |  | | 7.52, Sluggard (ok), 16:45, 03/09/2016 [^] [^^] [^^^] [ответить] | –1 +/– |  |  > Вы будете ржать, но автор сабжа учился на маркетолога. Но в какой-то > момент решил что труба шатал углы закруглять. И занялся сжатием. Преуспев
 > в этом получше многих других.
 Бывает, что такого. И анестезиологи вон ядро пишут. У меня приятель филолог писал под Symbian сперва на Python, потом на C++.
 |  |  | 
 | 
 | 
 | 
 | 
 | 
 |  | | 3.8, Crazy Alex (ok), 12:50, 01/09/2016 [^] [^^] [^^^] [ответить] | +10 +/– |  |  Ужас-то какой. Вообще-то работа на дядю в IT в большинстве случаев на порядок комфортнее и спокойнее работы на себя. И не факт, что в минус по деньгам. Работая на себя слишком много профессий совмещать приходится.
 |  |  | 
 | 3.30, Аноним (-), 20:34, 01/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | А в чем работа на дядю состоит? Чувак что так пилил свой алгоритм что эдак. Дядя заинтересовался в этом результате и нанял чувака чтобы тот мог делать то что делает фултайм. Результвт доступен что дяде, что чуваку, что нам с вами. В последних ревизиях годный кстати алгоритм. Жмет лучше zlib и при том распаковывается быстрее. Именно с zstd яппл собезьянничал свой алгоритм.
 |  |  | 
 | 
 | 2.12, Аноним84701 (?), 13:45, 01/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | > Кто-нибудь пояснит, при чём здесь Facebook? До этого я думал, что автором > Zstd является автор алгоритма LZ4 и открыт он был ещё в
 > начале прошлого года, если не раньше: https://www.opennet.me/opennews/art.shtml?num=41534
 Поясняю: автору не только новые алгоритмы изобретать, но иногда в процессе изобретательства и кушать  хочется,  да и ночевать скорее всего предпочитает в теплой постельке, под крышей ;)
 
 |  |  | 
 |  | | 3.38, Аноним (-), 21:40, 01/09/2016 [^] [^^] [^^^] [ответить] | –1 +/– |  | Кушать, крыша и тёплая постелька несовместимы с понятиями Настоящей Свободы. 
 |  |  | 
 | 
 | 2.13, Andrey Mitrofanov (?), 14:04, 01/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | > Кто-нибудь пояснит, при чём здесь Facebook? До этого я думал, что автором > Zstd является автор алгоритма LZ4 и открыт он был ещё в
 > начале прошлого года, если не раньше: https://www.opennet.me/opennews/art.shtml?num=41534
 Ср.:
 25.01.2015 09:47  Автор LZ4 представил новый быстрый и эффективный алгоритм сжатия ZSTD
 Ян Колле (Yann Collet), автор эталонной реализации алгоритма LZ4, представил новый [...]
 и
 https://code.facebook.com/posts/1658392934479273/smaller-and-faster-data-compr
17 hours agoData · Performance · Storage
 Smaller and faster data compression with Zstandard
 Yann Collet Chip Turner
 People are creating, sharing, and storing [...]
 
Выводы?
 
 |  |  | 
 |  | | 3.23, qwerty (??), 18:34, 01/09/2016 [^] [^^] [^^^] [ответить] | –1 +/– |  | >- изящно вынести специфический(!) словарь в ../ если данных терабайтами и при этом вариабельность 100k словаря за год  0%,
то почему бы и нет?
 
 |  |  | 
 |  | | 4.47, . (?), 14:42, 02/09/2016 [^] [^^] [^^^] [ответить] | –1 +/– |  | >> - изящно вынести специфический(!) словарь в ../ > если данных терабайтами и при этом вариабельность 100k словаря за год  0%,
 вы совсем читать не умеете? Ну ладно первоисточник ниасилить (это ж надо было весь этот булшит не просто прочесть по диагонали, но и проверить подозрительный момент) - но слово _специфический_ вами тоже не понято?
 Сперва тренируем на конкретном наборе данных, потом показываем счастливым лохам, как легко и быстро этот самый набор сжимается. Словарь при этом забываем в ../, время его составления тоже ингнорируем, все счастливы и танцуют.
 
 |  |  | 
 | 
 | 3.36, Аноним (-), 21:05, 01/09/2016 [^] [^^] [^^^] [ответить] | +6 +/– |  | > Теперь прикинем, как это будет внутри какой-нибудь rasp pi, где нет branch > prediction (и любой branchless код просто длиннее и медленнее нормального), дорогая
 > 64битная арифметика, где нет лишних ядер, лишней памяти -
 Я сравнивал разные LZ-образные на одноядерном ARMv7. Это несколько отличается от x86.
 1) LZ4: по прежнему в лидерах скорости сжатия/распаковки. Может догнаться до скорости memcpy(), а на хорошо сжимаемых данных даже обогнать memcpy (вероятно, разгрузив read исходных данных из оперативы по сравнению с memcpy). Ratio как обычно скромный. А он сильно жать в принципе не может. Не для этого он.
 2) Zstd: в отличие от x86 где zstd заметно быстрее zlib, на ARM zstd примерно как zlib. Ну может капельку быстрее иногда. Но жмет все-равно значительно лучше zlib'а. Профит по любому.
 3) Brotli. Это уже тяжеловес. По скорости на ARM уже несколько сливает zlib. Но жмет кардинально плотнее и на верхних уровнях приближается к LZMA. Распаковываясь в ТРИ РАЗА быстрее чем LZMA на том же проце. Тоже вполне приятный tradeoff. Нагло жульничает на вебне используя встроенный словарь на добрых 120 кило.
 |  |  | 
 |  | | 4.48, . (?), 15:05, 02/09/2016 [^] [^^] [^^^] [ответить] | –1 +/– |  | > Я сравнивал разные LZ-образные на одноядерном ARMv7. Это несколько отличается от x86. спасибо, это как раз то, чего не сделали авторы - что и вызывает у меня удивление. Скудоумием они явно не могли страдать, значит - намеренная и осознаваемая подмена понятий. 
Причем совсем непонятно, чего ради - на первый взгляд и честный анализ должен был дать достаточно достойные результаты. Ну а раз совравшему уже не хочется доверять и в остальном - вдруг оно, к примеру, каждый пятый файл вообще не cможет потом распаковать.
 > проце. Тоже вполне приятный tradeoff. Нагло жульничает на вебне используя встроенный 
> словарь на добрых 120 кило.
 ну это не нагло. Нагло это в исходной статье - сперва пообучать алгоритм, потом отложить словарик, потом _эти_же_ данные (не какие-то похожие, а именно те) сжать. (причем оно таки делало zlib чуть ли не в восемь раз даже с учетом словаря, совершенно неясно, зачем понадобилось такое мелкое жульничество. Возможно, ларчик откроется, если засечь время обучения- вызов time там тоже скромно опущен ;) Если словарь является частью программы, ничего плохого в этом я не вижу (как, собственно, и в специфическом словаре, упакованном вместе с данными, кто-то из ранних досовских архиваторов именно так и работал...аццки долго ;)
 |  |  | 
 |  | | 5.53, Аноним (-), 17:11, 03/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | Больше похоже на то что они так просто не умеют  ARM вообще забавные штуки  Там ... большой текст свёрнут, показать |  |  | 
 | 
 | 
 | 3.46, arisu (ok), 10:14, 02/09/2016 [^] [^^] [^^^] [ответить] | +/– |  |  > Поневоле закрадываются сомнения - там все остальное-то нормально сделано? нормально. просто подобные штуки хоть и не принято сейчас называть «пресс‐релизы», но по сути это именно пресс‐релиз. соответственно, рассказывается о плюсах, умалчивается о минусах и всё такое. потому что надо продать. кому непонятно, что именно продаётся — пусть спускается с небес.
 |  |  | 
 |  | | 4.54, Аноним (-), 17:26, 03/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | Автор zstd должен был стать маркетологом. Но как-то случайно подсел на алгоритмы и програмизм. Это ему настолько вштырило что он послал карьеру маркетолога и занялся алгоритмами сжатия. Так что он умеет преподнести себя в выгодном свете. Но соль не в том. Он упрямый чувак, хорошо разбирается в оптимизациях и поэтому смог догнаться до высот на которых сломали зубы многие матерые програмеры. Zstd не самый быстрый и не самый плотный. Зато он практичный и серьезно претендует на нишу zlib, который с точки зрения технологий мало ушел от эпохи DOSовых архиваторов. Zstd в той же нише, только лучше. И по скорости распаковки и по достижимой степени сжатия.
 |  |  | 
 |  | | 5.55, arisu (ok), 17:30, 03/09/2016 [^] [^^] [^^^] [ответить] | +/– |  |  а я нигде не писал, что сабж плохой, если что. я просто немного потоптался на форме презентации. 
 |  |  | 
 |  | | 6.59, Аноним (-), 18:25, 03/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | > а я нигде не писал, что сабж плохой, если что. я просто > немного потоптался на форме презентации.
 Топтаться на презентации маркетолога занятие неблагодарное. Маркетологи это умеют. А то что одним маркетологом меньше и одним програмером больше - вообще фича :P.
 |  |  | 
 | 
 | 
 | 
 | 
 | 
 
 
|  | | 2.5, Аноним (-), 12:08, 01/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | Реализация в виде кода была сделана автором LZ4 и было выпущено много версий. И только к последней версии под номером 1.0.0 примазался Facebook. 
 |  |  | 
 |  | |  | |  | | 5.31, Аноним (-), 20:38, 01/09/2016 [^] [^^] [^^^] [ответить] | –1 +/– |  | > А так можно? MIT вроде не допускает перелицензирование? В mit как и bsd - полтора условия. Поверх которых можно нашлепнуть любые другие без нарушения лицензии ;). Проприерасы вообще EULA всем в рожу тычут, и ничего, так можно. А GPL чем принципиально отличается от других лицензий? :)
 |  |  | 
 | 
 | 
 | 
 | 
 
 | 1.7, mmm (??), 12:41, 01/09/2016  [ответить] [﹢﹢﹢] [ · · · ] | –1 +/– |  | А если туда ещё и lepton подмешать - на jpg-ах всех порвёт. 
 |  |  | 
 
 | 1.9, Аноним (-), 13:10, 01/09/2016  [ответить] [﹢﹢﹢] [ · · · ] | +/– |  | А почему никто не обращает внимание на фрактальное сжатие? Патенты уже истекли. 
 |  |  | 
 
|  | | 2.18, Аноним (-), 16:06, 01/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | > А почему никто не обращает внимание на фрактальное сжатие? Патенты уже истекли. две причины - оно сильно Ассиметрично. распаковка - весьма шустра а сжатие в десятки, порой сотни раз медленее.
а второе - там необычная математика и ... программисты - просто не осилят прикручивать либы(две компании, лицензировавшие у луравэйв/лизардтех уже после покупки остатков итератед оными в конце нулевых - так и не смогли купленные либы прикрутить к своему решению, несмотря на то что в Ф500 входят и опыт "абстрактной" разработки софта у них - был).
 
 
 |  |  | 
 |  | | 3.33, Аноним (-), 20:50, 01/09/2016 [^] [^^] [^^^] [ответить] | –1 +/– |  | Обычный Lempel-Ziv к этому вполне склонен и у того же Zstd есть высокие уровни с... большой текст свёрнут, показать |  |  | 
 | 
 | 
 
 
|  | | 2.28, Аноним (-), 20:32, 01/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | >> конечного состояния энтропии (Finite State Entropy) > МГИМО финишд?
 Аск
 |  |  | 
 | 
 
 
|  | |  | | 3.34, Аноним. (?), 20:54, 01/09/2016 [^] [^^] [^^^] [ответить] | –1 +/– |  | > МПеговый дудочник MPEGLA'овый :)
 Впрочем для MPEGLA тоже подарочек есть: https://aomedia.googlesource.com/aom - эта крутень дает довольно приличную картинку 1080P даже при ... 500 Кбит?! Вау. Эй, H.264 а попробуй так же? И чтоб не превратиться в блочную муть? :)
 |  |  | 
 |  | |  | | 5.44, Аноним (-), 09:52, 02/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | тогда уж AV1 и Daaala, Thor ;) Theora-у ванильную - тоже вяло(но ощутимо)допиливают да и VP8, VP9 для "внутреннего использования" гугль юзает вовсю )
 
 |  |  | 
 |  | | 6.58, Аноним (-), 18:24, 03/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | > тогда уж AV1 и Daaala, Thor ;) > Theora-у ванильную - тоже вяло(но ощутимо)допиливают да и VP8, VP9 для "внутреннего
 > использования" гугль юзает вовсю )
 На VP8 почти забили. Из него сильно больше уже не выжмешь. VP9 достаточно активно пилят и фиксят. Daala частично внедрили в AV1, который в первом приближении смесь VP10 с Daala, может и из Thor чего-то выдрали. Основные коммитеры - из daala и vp10.
 |  |  | 
 | 
 | 5.56, Аноним (-), 18:20, 03/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | Наздоровье, гугл и ко задались целью его уделать  И уже уделывают существующие р... большой текст свёрнут, показать |  |  | 
 | 
 | 
 | 
 | 
 
 | 1.26, Аноним (-), 20:24, 01/09/2016  [ответить] [﹢﹢﹢] [ · · · ] | +/– |  | Использую в двух своих проектах. При равной скорости векторные изображения жмет на 40% сильнее zlib. 
 |  |  | 
 
|  | | 2.35, Аноним (-), 20:57, 01/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | > Использую в двух своих проектах. При равной скорости векторные изображения жмет на > 40% сильнее zlib.
 Да почти все жмет лучше чем zlib. Особенно если данных больше чем 32Кб. Все-таки 32 Кб окно без возможности увеличения - ловит мало совпадений. Ну и FSE как вторая стадия - это такой удачный компромисс где скорость побольше чем у хаффмана при том что степень сжатия на уровне арифметического кодиорования. Это Jarek Duda придумал свой ANS и потом пополам с спецами по сжатию прикрутили все это к реальным алгоритмам. Так появился FSE.
 |  |  | 
 | 
 
 
 | 1.45, arisu (ok), 10:10, 02/09/2016  [ответить] [﹢﹢﹢] [ · · · ] | +2 +/– |  |  словари рулят. берёшь, значит, весь исходный файл, и засовываешь его в словарь. БУМ! всех порвал, мегасжатие, скорость потрясающая, памяти почти не требует. вообще, многопроходное сжатие — скучное читерство.
 |  |  | 
 
|  | | 2.57, Аноним (-), 18:21, 03/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | > вообще, многопроходное сжатие — скучное читерство. А в каком месте optimal parsing например - читерство?
 |  |  | 
 |  | | 3.60, arisu (ok), 18:54, 03/09/2016 [^] [^^] [^^^] [ответить] | +/– |  |  >> вообще, многопроходное сжатие — скучное читерство. > А в каком месте optimal parsing например - читерство?
 именно в том. читерство и есть, к тому же ещё и тормозное.
 |  |  | 
 | 
 | 2.62, нах (?), 10:02, 05/09/2016 [^] [^^] [^^^] [ответить] | +/– |  | > словари рулят. берёшь, значит, весь исходный файл, и засовываешь его в словарь если вы внимательно прочитали статью - там именно так и сделано (только не файл, а файлы)
Сам словарь предусмотрительно вынесен в ../, поэтому к размеру сжатых данных не отнесен.
 То есть не как у гугля - потренировали на своих данных, и потом жмем любые похожие (и фейлимся на похожих, но недостаточно похожих), а именно словарь под эти конкретные.
 > вообще, многопроходное сжатие — скучное читерство.
 вообще - нет. Читерство начинается, когда размер такого словаря и время на его создание "как-то вот забыли учесть".
 Для данных которые "сжимаются один раз, распаковываются тыщу" нет ничего ужасного в том, что при сжатии тратится время на словарь. До тех пор, пока однопроходное сжатие не оказывается только на пару процентов хуже ;-)
 В общем, совершенно загадочно, зачем им это понадобилось - когда и честное сравнение в их пользу.
 |  |  | 
 |  | | 3.63, arisu (ok), 10:37, 05/09/2016 [^] [^^] [^^^] [ответить] | +/– |  |  дык я не говорил, что оно всё плохо. я сказал, что оно скучное читерство. лично мне хватает zlib, который всё равно уже есть в любой системе, а нет — так разжиматель после deflate пишется в несколько килобайт. поэтому я интересуюсь остальным чисто с точки зрения: «а это интересно?» неа, неинтересно: и не ново, и не особо впечатляет, и к тому же для лучшего сжатия рекомендуют читерить. скука. p.s. zlib, кстати, тоже умеет в 'deflateSetDictionary()' и 'inflateSetDictionary()'.
 |  |  | 
 | 
 | 
 
 |