Ionel Mugurel Ciobica wrote:
On 2-11-2009, at 15h 44'31", Adrian Sevcenco wrote about "Re: [rlug] comparare
diverse computere"
Doar daca rulezi testul pe o singura masina cu un singur thread de
procesare. in cazul de mai multe masini si daca programul e paralel
conteaza mai mult ca cpu-ul reteaua (gigE, 10gigE, infiniband).
Din nefericire comunicatia intre procesoarele aflate pe aceeasi placa
de baza este mult mai inceata decit comunicarea dintre procesoarele
...errrr.. nu inteleg ... exista astfel de hardware sau ai vrut sa spui
altceva si a iesit pe dos? eu dupa mintea mea ma gindesc ca nu are cum
sa ai comunicare mai rapida in exterior decit pe FSB/QPI. (mai ales ca
nu latimea de banda conteaza ci pe primul loc latenta).
aflate fizic pe alte placi de baza, asa ca nu conteaza daca este
gigabit sau are infiniband, etc.
Daca vrei doar sa faci benchmarkul procesorului compari single core cu
single core (ca nu are sens sa compari un dual core cu un quad) mai ales
ca nu stii cum se scaleaza threadurile.. dar poti sa afli facind si un
test de scalare : pe aceiasi masina ruleazi acelasi program pt 1..N
core-uri (presupun aplicatia ca fiind paralela si nu distribuita caz in
care nu conteaza numarul de coreuri (scalarea e 1:1 (ignorind IO-ul)) ci
numai IO-ul la date)
Nu ma intereseaza benchmarkul procesorului, ci doar impartirea
echitabila a unor resurse neomogene unui grup de oameni care ruleaza
acceasi aplicatie. Si nu vreau ca fiecare sa primeasca cite 2-3
proceasore din fiecare PC-cluster numai ca sa fie totul exact la fel.
La acest punct deja trebuie sa spui ce tip de aplicatie e : de calcul
paralel sau de calcul distribuit. Avind in vedere aceata fraza te-as
indruma catre documentatie de MAUI/Torque (daca folosesti aceasta
combinatie de resource manager/job scheduler) daca nu ce folosesti?
(intre optiuni s-ar regasi Condor, LSF, SGE (Sun Grid Engine))
In schimb daca folosesti ceva cu MPI(sau MPICH) e clar o chestie
paralela... caz in care ar fi interesant de vazut si analizat traficul
in retea.
Am rulat teste (mai demult) pe 1..N procesoare si concluzia a fost ca
cel mai bine este sa fie rulata aplicatia pe 6-8 procesoare, pe mai
putine sau mai multe timpuil de asteptare raportat pe procesor era
foarte mare.
Asta poate sa fie din cauza IO-ului la date (daca aplicatia e de calcul
distribuit)
Din primul paragraf al primului mail am inteles ca vrei sa faci becnmark
de CPU pt aplictia ta... daca s-a inteles gresit mai detaliaza exact ce
intentionezi sa afli si in ce scop .. poate asha esti ajutat mai bine ;)
Adrian
_______________________________________________
RLUG mailing list
[email protected]
http://lists.lug.ro/mailman/listinfo/rlug