Максимальное сжатие файлов (для веб-передачи)?

Я видел несколько сжатых файлов, таких как 700 МБ данных, сжатых до 30-50 МБ.

Но как вы получаете такие сжатые файлы? Я пробовал использовать программное обеспечение, такое как WinRAR и 7Zip, но никогда не достигал такого высокого сжатия.

  • Как избежать сжатия сжатых файлов
  • Как извлечь файл gpg
  • Сжатие pdf, созданное офисом 2007
  • Каковы методы / программное обеспечение, которые позволяют вам сжимать файлы так хорошо?

    (PS Я использую Windows XP)

  • Как извлечь файл gpg
  • Как избежать сжатия сжатых файлов
  • Сжатие pdf, созданное офисом 2007
  • 9 Solutions collect form web for “Максимальное сжатие файлов (для веб-передачи)?”

    Если время сжатия данных не является проблемой, вы можете оптимизировать сжатый размер, используя вместе несколько разных инструментов.

    Сжимайте данные несколько раз, используя различные инструменты, такие как 7zip, winrar (для zip) и bjwflate.

    (Обратите внимание, что это не означает сжимать zip-файл много раз, а скорее создавать ряд альтернативных zip-файлов, используя разные инструменты)

    Затем запустите deflopt в каждом архиве, чтобы немного уменьшить каждый архив.

    Наконец, запустите zipmix в коллекции архивов. Поскольку различные zip-инструменты лучше подходят для разных файлов, zipmix выбирает лучшую сжатую версию каждого файла из каждого архива и производит результат, который меньше любого, который любой из zip-инструментов мог бы производить отдельно.

    Тем не менее, вы должны отметить, что в ваших файлах не гарантируется какая-либо магия. Некоторые типы данных просто не сжимаются очень хорошо, как JPEG и MP3. Эти файлы уже сжаты внутри.

    Это полностью зависит от сжатых данных.

    Текст сжимается очень хорошо, двоичные форматы не так хорошо и сжатые данные (mp3, jpg, mpeg) совсем отсутствуют.

    Вот хорошая таблица сравнения сжатия из wikipedia.

    Предыдущие ответы неверны на порядок!

    Лучший алгоритм сжатия, с которым у меня есть личный опыт, – paq8o10t (см. Страницу zpaq и PDF ).

    Подсказка: команда для сжатия files_or_folders будет выглядеть так:

    paq8o10t -5 archive files_or_folders 

    Размер архива относительно времени для сжатия и извлечения 10 ГБ (79 431 файл) на внешний жесткий диск USB по умолчанию и максимальным настройкам на ноутбуке Dell Latitude E6510 (Core i7 M620, 2 + 2 гипертекста, 2,66 ГГц, 4 ГБ, Ubuntu Linux , Wine 1.6). Данные из теста 10 ГБ (система 4).

    Источник: инкрементная утилита резервного копирования журналов и архивирование

    Вы можете найти зеркало исходного кода на GitHub .


    Немного лучший алгоритм сжатия и победитель премии Hutter – decomp8 (см. Ссылку на странице приза). Тем не менее, нет никакой программы компрессора, которую вы действительно можете использовать.


    Для действительно больших файлов lrzip может достичь коэффициентов сжатия, которые просто комичны .

    Пример из README.benchmarks:


    Давайте возьмем шесть деревьев ядра в одной версии отдельно как tarball, linux-2.6.31 – linux-2.6.36. Они будут отображать много избыточной информации, но сотнями мегабайт друг от друга, которые lrzip будет очень хорош в сжатии. Для простоты будет сравниваться только 7z, поскольку на данный момент это лучший компрессор общего назначения:

    Это эталонные тесты на двухъядерном Intel Core2 с частотой 2,53 ГГц с 4 ГБ оперативной памяти с использованием lrzip v0.5.1. Обратите внимание, что он работал с 32-разрядным пользовательским пространством, поэтому было разрешено только адреса 2 ГБ. Однако эталонный тест выполнялся с опцией -U, позволяя обрабатывать весь файл как одно большое окно сжатия.

    Тарбол из 6 последовательных деревьев ядра.

     Compression Size Percentage Compress Decompress None 2373713920 100 [n/a] [n/a] 7z 344088002 14.5 17m26s 1m22s lrzip 104874109 4.4 11m37s 56s lrzip -l 223130711 9.4 05m21s 1m01s lrzip -U 73356070 3.1 08m53s 43s lrzip -Ul 158851141 6.7 04m31s 35s lrzip -Uz 62614573 2.6 24m42s 25m30s 

    Squeezechart.com содержит сравнения различных степеней сжатия. Хотя, как заявил ответ Нифле, вы вряд ли получите такие высокие коэффициенты сжатия для двоичных форматов.

    Большинство инструментов сжатия имеют настройки, позволяющие достичь более высокой скорости сжатия при компромиссе медленного времени сжатия / декомпрессии и большего использования ОЗУ.

    Для 7-Zip выполните поиск «Диалоговое окно« Добавить в архив »в встроенной справке для более подробной информации.

    Вы можете попробовать 7zip со следующими настройками:

     7z a -t7z -m0=lzma -mx=9 -mfb=64 -md=32m -ms=on big_file.mysql.7z big_file.mysql 

    Просто проверьте Сводку тестов тестирования множественного сжатия файлов, который имеет лучший список сжатия, который включает в себя полный тест сжатия.

    Топ 30

    Введите описание изображения здесь

    Лучшие исполнители (основанные на сжатии) в этом тесте – PAQ8 и WinRK (PWCM). Они могут сжать набор тестов 300+ Мб до уровня ниже 62 Мб (уменьшение на 80%), но для завершения теста потребуется минимум 8,5 часа. Программа номер один (PAQ8P) занимает почти 12 часов и номер четыре (PAQAR) даже 17 часов для завершения теста. WinRK, программа со вторым лучшим сжатием (79,7%) занимает около 8,5 часов. Неудивительно, что во всех упомянутых программах используется усилитель PAQ (-подобный) для сжатия. Если у вас есть файлы со встроенными изображениями (например, файлы Word DOC), используйте PAQ8, он распознает их и раздельно сжимает, значительно увеличивая сжатие. Все упомянутые программы (кроме WinRK) бесплатны.

    Ваш лучший выбор здесь, кажется, проб и ошибок. Попробуйте все имеющиеся методы сжатия в каждом файле и выберите лучшее, что можно разместить на своем веб-сайте. К счастью, компьютеры делают это довольно быстро и не скучают. Вы могли бы написать простой скрипт для автоматизации процесса, чтобы он был «относительно безболезненным».

    Просто не ожидайте, что чудеса – 700 мб до 30 мб просто не случаются так часто. Файлы журналов, как указано выше, да. «Ваш средний файл» – никак.

    Nanozip, похоже, имеет самое высокое сжатие вместе с FreeArc. Но это еще не окончательная версия. Существует то, как достигается хорошее сжатие Nanozip . Он имеет очень высокое сжатие, и это не занимает слишком много времени, проверьте Сводку тестов тестирования множественного сжатия файлов , но FreeArc работает быстрее.

    Давайте будем гением компьютера.