引用:
原帖由 quick 于 2008-4-28 00:22 发表 
补充一下,上面所说的压缩比为75%,是指可以压缩的数据的压缩比,不是指综合,如果综合起来算的话,一个随机文件,压缩比90.5%+0.75*9.5%=97.6%,也就是说100M的文件压缩成97.6M。
对于大于4位的数据压缩,分析起 ...
很精辟的分析,如果你能看出这些问题,其码能让明您认真看了算法,虽然你和我站在讨论问题相反的立场上,但由于您很仔细的进行分析和出于技术的目的讨论,而不是像其它人总要给别人讲什么高中科普,所以我还是很高兴回答您的问题的。
当前的算法我是用了质,但请您想信在数学中不只是质这一种性质可以区别数字的不同性的,它只是最简单的一种方法,所以我用了,能给别人讲清问题自已又省时间
不过我当然可以用更高级或复杂的方法,例如我前面说的矩阵,当然这就要程序为一系列数字准备模板,这个概念我不在这里讨论,因为会非常复杂,但我想数学有一定基础的人能理解我的意思,要我用矩阵实现吗?,根据目前我的想法有实现的可能,而且还是根据我这种水平不太高的程序员来讲,但我真的不想再为别人能够理解一个问题而反复去写这种代码了,我现有的时间还要靠写软件换钱糊口,这句话我自已都嫌烦了。
所以我说如果用复杂的矩阵还是会比这个压缩比高的,而且请你注意一个很关键的问题,那就是分子分母的方法,没有排除冗余的那种限制,你可能会对你现有的压缩结果重新组合而再次进行压缩,对吧,如果您对压缩结果循环下去会怎样呢?这个我不清楚。
而且让我最高兴看到的是,您最后得出了一个结论,
您说的话:也就是说100M的文件压缩成97.6M,
用质的方法进行分子分母算法就可达到这种程度了,对吧,这可是您说的,而且还是不知道这个97.6可不可以再次循环压缩的前提下,因为我说过分子分母不是排除冗余,所以目前所知它可能不受第二次压缩的限制。

但是您说我强奸别人的本意,帽子扣大了吧,我记得前面的贴子,大牛们一直在口口声声告诉我这个根本就是无法实现的,而且就连个基础理论都没有,就是说从原理上讲就行不通,这个我没记错吧。
但如果现在返回来又说压缩比的问题了,我想就是在玩文字游戏了。
我为这个贴子浪费了很多时间,所以如果下一个文章没有人能像您一样的仔细对技术分析或提出什么技术亮点的话,我不会再回贴了。
不过我很兴高的看到这次讨论中,真的有强人可以站到更高处,把问题看的更远,下面我想引用一句enthappy前辈的话:
他说:因为它的压缩机制和 LZW 算法不同,有可能能压缩 winzip 之类压缩后的数据,你不会说 winzip 已经到极致了吧
这其实才是我佩服的技术高人的想法。
如果不理解,那我告诉你,看到4312这个数字了吗?能排除冗除吗?但那个笨蛋的程序可以把它压成三位,如果我们有可能组合两种算法会出现什么样的结果呢?winzip被优化了
我希望在我们当中多一些这种会把问题看的更远的技术高人,而不是科普老师。
谢谢您的提问.