<html>
<head>
<style>
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Verdana
}
</style>
</head>
<body class='hmmessage'>
<br><br>&gt; From: ckutzne@gwdg.de<br>&gt; To: gmx-users@gromacs.org<br>&gt; Subject: Re: [gmx-users] Best performace with 0 core for PME calcuation<br>&gt; Date: Mon, 12 Jan 2009 10:41:26 +0100<br>&gt; <br>&gt; On Jan 10, 2009, at 8:32 PM, Nicolas wrote:<br>&gt; <br>&gt; &gt; Berk Hess a écrit :<br>&gt; &gt;&gt; Hi,<br>&gt; &gt;&gt;<br>&gt; &gt;&gt; Setting -npme 2 is ridicolous.<br>&gt; &gt;&gt; mdrun estimates the number of PME nodes by itself when you do not  <br>&gt; &gt;&gt; specify -npme.<br>&gt; &gt;&gt; In most cases you need 1/3 or 1/4 of the nodes doing pme.<br>&gt; &gt;&gt; The default -npme guess of mdrun is usually not bad,<br>&gt; &gt;&gt; but might need to tuned a bit.<br>&gt; &gt;&gt; At the end of the md.log file you find the relative PP/PME load<br>&gt; &gt;&gt; so you can see in which direction you might need to change -npme,<br>&gt; &gt;&gt; if necessary.<br>&gt; &gt; Actually, I have tested npme ranging from 0 to 5, but 2 is well  <br>&gt; &gt; representative of what happens. For example with 5 cores for the  <br>&gt; &gt; PME, the perfs reach a plateau at 14-15 cores. So, setting npme to 0  <br>&gt; &gt; systematically gives the best results. I have also tested -1. With,  <br>&gt; &gt; npme set to -1, the performances are the same than for 0 until 8  <br>&gt; &gt; cores. Above that, the guess is not so efficient.<br>&gt; <br>&gt; Hi Nicolas,<br>&gt; <br>&gt; as Berk mentioned, you should expect a different optimal number of PME  <br>&gt; nodes for<br>&gt; each number of total nodes you test on. So the way to go is to fix the  <br>&gt; number of total<br>&gt; nodes and vary the number of PME nodes until you find the best  <br>&gt; performance for that<br>&gt; number of nodes. Then move on to another number of total nodes. I have  <br>&gt; written<br>&gt; a small tool that does a part of this job for you by finding out the  <br>&gt; optimum number<br>&gt; of PME nodes for a given number of total nodes. If you want to give it  <br>&gt; a try, I can<br>&gt; send it to you. Typically the optimum number of PME nodes should not  <br>&gt; be too far<br>&gt; off the mdrun estimate. If it is far off, this could point out some  <br>&gt; network or MPI<br>&gt; problem. Note that separate PME nodes can only work if the MPI ranks  <br>&gt; are not scattered<br>&gt; among the nodes, i.e. on 4-core nodes the ranks 0-3 should be on the  <br>&gt; same node<br>&gt; as well as ranks 4-7 and so on. This is printed at the very start of a  <br>&gt; parallel<br>&gt; simulation.<br>&gt; <br>&gt; Carsten<br><br>"Can only work if" should be rephrased as "Will be most efficient when".<br>If the MPI ranks are&nbsp; scattered over the nodes you should probably use<br>-ddorder pp_pme.<br><br>In most cases using seprate PME nodes will become more efficient<br>somewhere between 8 and 12 total nodes.<br><br>Berk<br><br><br /><hr />Express yourself instantly with MSN Messenger! <a href='http://clk.atdmt.com/AVE/go/onm00200471ave/direct/01/' target='_new'>MSN Messenger</a></body>
</html>