On Wed, 17 Feb 2010, Dan Lukes wrote: > A jestli ne ? > > Zalezi jestli budou soubory casteji shodne nebo casteji ruzne. Pokud se da > ocekavat, ze budou vetsinou ruzne, pak si muzeme dovolit v pripade shodneho > hashe soubory skutecne 1:1 porovnat. Nebudeme to delat casto. > > Pokud se naopak da ocekavat, ze soubory jsou vetsinou shodne je vhodnejsi jiny > postup - spocitat druhy hash jinym algoritmem. Treba md4 (u me 11 sekund).
pravdepodobnost, ze nahodne vybrane 2 soubory budou mit stejny MD5 hash, je 1/2^128, je to tak? Ruznych moznosti, jak to vyjde, je 2^128*2^128, a moznosti, kdy je hash stejny, je 1^128. Z toho mi vychazi 1/2^128. je "potreba" dal kontrolovat? Pokud ano, to uz asi je potreba kontrolovat bajt po bajtu, protoze ani 2 nebo 3 ruzny algoritmy uz nemusi stacit. muze se nam stat chyba pokud pouzijeme hash? Samozrejme muze, ja nerekl ze ne. Ale stejne jako u bezpecnosti, nejslabsi clanek je ten rozhodujici. MD5 to zde opravdu neni. > Pravdepodobnost simultanni kolize dvou ruznych algoritmu na neshodnych datech > je uz opravdu velice mala. ja si nemyslim, ze udelat dalsi sumu neni fajn, ale opravdu si myslim, ze je to v uvazovanym pripade naprosto zbytecny. h. -- Jan Pechanec <jp (at) devnull (dot) cz> http://www.devnull.cz -- FreeBSD mailing list (users-l@freebsd.cz) http://www.freebsd.cz/listserv/listinfo/users-l