On Wed, 17 Feb 2010, Dan Lukes wrote:

> A jestli ne ?
>
> Zalezi jestli budou soubory casteji shodne nebo casteji ruzne. Pokud se da
> ocekavat, ze budou vetsinou ruzne, pak si muzeme dovolit v pripade shodneho
> hashe soubory skutecne 1:1 porovnat. Nebudeme to delat casto.
>
> Pokud se naopak da ocekavat, ze soubory jsou vetsinou shodne je vhodnejsi jiny
> postup - spocitat druhy hash jinym algoritmem. Treba md4 (u me 11 sekund).

        pravdepodobnost, ze nahodne vybrane 2 soubory budou mit stejny MD5 
hash, je 1/2^128, je to tak? Ruznych moznosti, jak to vyjde, je 2^128*2^128, 
a moznosti, kdy je hash stejny, je 1^128. Z toho mi vychazi 1/2^128.

        je "potreba" dal kontrolovat? Pokud ano, to uz asi je potreba 
kontrolovat bajt po bajtu, protoze ani 2 nebo 3 ruzny algoritmy uz nemusi 
stacit.

        muze se nam stat chyba pokud pouzijeme hash? Samozrejme muze, ja 
nerekl ze ne. Ale stejne jako u bezpecnosti, nejslabsi clanek je ten 
rozhodujici. MD5 to zde opravdu neni.

> Pravdepodobnost simultanni kolize dvou ruznych algoritmu na neshodnych datech
> je uz opravdu velice mala.

        ja si nemyslim, ze udelat dalsi sumu neni fajn, ale opravdu si 
myslim, ze je to v uvazovanym pripade naprosto zbytecny.

        h.

-- 
Jan Pechanec <jp (at) devnull (dot) cz>
http://www.devnull.cz
-- 
FreeBSD mailing list (users-l@freebsd.cz)
http://www.freebsd.cz/listserv/listinfo/users-l

Odpovedet emailem