Tag Archives: gz

อัลกอริทึมใหม่จากกูเกิล Zopfli บีบอัดไฟล์อัตราส่วนดีกว่า 7-zip จริงหรือ

มีข่าวว่า “กูเกิลเปิดตัว Zopfli อัลกอริทึมบีบอัดไฟล์แบบใหม่ที่ให้อัตราส่วนดีกว่า 7-zip” เลยขอพิสูจน์หน่อย อีกทั้งไปเห็นที่ CNX-Soft ได้ทดลองแล้ว ลองกับเขาบ้าง จะใช้ไฟล์ enwik8 ซึ่งมีขนาดร้อยล้านไบต์พอดีเปะจาก http://mattmahoney.net/dc/textdata.html ซึ่งใช้เพื่อ Large Text Compression Benchmark

เลียนแบบวิธีใน CNX-Soft แต่ใช้แค่ -i1000 ครับ บีบแล้วได้ขนาด 34,988,599 ไบต์ ทวีตข้อความผิดไปหน่อย แต่ในรูปที่ capture มานั้นถูกแล้ว

วันต่อมา จึงลองกับ 7-Zip พบว่าสำหรับไฟล์นี้ 7-Zip บีบย่อได้ดีกว่าครับ โดยใช้ option ให้บีบอัดเต็มที่โดยไม่ได้ระบุอัลกอริทึม ซึ่งมันจะใช้แบบ LZMA ก็พบว่าบีบได้เล็กกว่าครับ คือ 24,861,205 ไบต์

enwik8-compare-7z-zip-zopfli

อันที่จริงที่ link ข้างบน Large Text Compression Benchmark ก็มีพูดถึง 7-Zip เหมือนกันครับ ใช้วิธีคล้ายๆ กัน แต่ใส่ option ให้ทำเป็น self-extractor ขนาดก็พอๆ กับที่ผมทดลอง

links แปะอ่าน
https://code.google.com/p/zopfli/source/browse/deflate.c (จุดนี้กำลังไล่ดูอยู่ครับ อัลกอริทึมนี้จะบีบย่อไฟล์ให้ได้ฟอร์แมตที่อัลกอริทึมคลายไฟล์แบบเดิม คลายได้)
http://encode.ru/threads/1689-Google-Compress-Data-More-Densely-with-Zopfli?p=32537&viewfull=1#post32537
https://twitter.com/ohmohm/status/308073421814763522

Advertisements