A Model for Parallel Job Scheduling on Dynamic Computer Grids

A Model for Parallel Job Scheduling on Dynamic Computer Grids. Alfredo Goldman. Carlos Queiroz. Department of Computer Science - University of São

RS[ ][b] TU WXf^\T‰[` ^U eWaaWVUh ŠTXU]n V[ ZX[U[\] ]S[ ^`WZ][` _W`[a ^\` ]S[ l^UTc ^afWXT]S_Uh RS[\n V[ USWV SWV T] c^\ l[ [^UTaj T_Za[_[\][`h k[ cW\{ cad`[ VT]S UW_[ T`[^U eWX ed]dX[ VWXYh \ WdX VWXY V[ T\][\` ]W dU[ ]S[ ^`g^\]^f[U We ^ _da]T{cadU][X [\gTXW\_[\] VT]S UW_[ cW\U]X^T\]U ]W cX[^][ ^ ^`^Z{ ]^]Tg[ [\gTXW\_[\]h \ ]STU [\gTXW\_[\]n ]S[ cadU][X ^`_T\TU]X^]WXU USWda` l[ ^la[ ]W `j\^_Tc^aaj a[^g[ WX mWT\ ]S[ fXT`h ‹ ŒŽ rsŽ RS[ fXT` TU X[ZX[U[\][` lj ^ fX^ZS‘ ]S[ g[X]Tc[U cWX{ X[UZW\` ]W ]S[ ZXWc[UUT\f \W`[Un VSTcS c^\ l[ cadU{ ][XU We cW_Zd][XUn Z^X^aa[a _^cST\[Un WX [g[\ UT\fa[ cW_Zd][XUh RW cS^X^c][XT‰[ ]S[ `Tw[X[\] \d_l[X We ZXWc[UUT\f d\T]U W\ [^cS cadU][X ]W [^cS g[X][b ’ V[ ^UUWcT^][ T]U c^X`T\^aT]j “”h ŠWX U]^\` ^aW\[ cW_{ Zd][XU V[ S^g[ “” • yh RW UT_ZaTej ]S[ ^\^ajUTU V[ ^UUd_[ ]S^] ^aa cW_Zd][XU ^X[ [–d^ah k[ ^aUW `[\W][ UT\fa[ cW_Zd][XU ^U cadU][XU We UT‰[ W\[h RS[X[ ^X[ [`f[U T\][XcW\\[c]T\f ]S[ \[TfSlWXT\f g[X]Tc[U Te ]S[X[ TU ^ e^U] aT\Y l[]V[[\ ]S[_h |[X[n e^U] _[^\U UT_Ta^X a^][\cj ^\` l^\`VT`]S ^U T\UT`[ ^ `[`Tc^][` cadU][Xh |WV[g[Xn ^U T] TU \W] ^ `[`Tc^][` aT\Yn V[ UdZZWU[ ]S^] T] S^U VWXU[ Z[XeWX_^\c[ ]S^\ ^ aT\Y T\ ^ cadU][Xh RS[ _W]Tg^]TW\ eWX ]STU TU ]W cW\{ UT`[X ]S^] \W] ^aa cadU][XU ^X[ T\ ]S[ U^_[ `W_^T\h ŠWX [^cS g[X][b T\ ]S[ fX^ZS ]S[X[ TU ^ aWc^a UcS[`{ da[X VSTcS TU X[UZW\UTla[ eWX ]S[ Udl_TUUTW\ We aWc^a mWlUh RSTU aWc^a UcS[`da[X Z[XTW`Tc^aaj T\eWX_U ]S[ cdXX[\] aW^` We ]S[ cadU][X ]W ]S[ fXT` UcS[`da[Xn ^\`

T] TU ^aUW X[UZW\UTla[ eWX ^aaWc^]T\f fXT` mWlUh \ WdX _W`[an ]S[ aW^` TU UT_Zaj ]S[ \d_l[X We ^g^Ta^la[ ZXWc[UUWXUn UW ]STU \d_l[X TU ^\ T\][f[X fX[^][X WX [–d^a ]W ‰[XWh RS[X[ ^X[ ]VW `Tw[X[\] mWl ZXTWXT]T[Un W\[ eWX ]S[ aWc^a mWlU ^\` W]S[X eWX ]S[ fXT` mWlUh RS[ mWlU Udl_T]][` lj ]S[ fXT` UcS[`da[X S^g[ U_^aa[X ZXT{ WXT]jn ^\` ]S[TX ]^UYU c^\ l[ ZX[[_Z][`h RS[ mWlU Udl_T]][` lj ]S[ aWc^a ^`_T\TU]X^]WX USWda` \W] l[ _Wg^la[h k[ ^aUW ^UUd_[ ]S[ [bTU][\c[ We ^ _[cS^\TU_ ]W _TfX^][ ^ Z^X^aa[a mWln WX Z^X] We T]n eXW_ ^ cadU][X ]W ^\W]S[X W\[n ]STU c^\ l[ `W\[ dUT\f a^\fd^f[U aTY[  S^X_ x zn WX T\ ]S[ c^U[ We ^ Z^X^aa[a mWl VT]S cW_{ _d\Tc^]T\f ]^UYU lj a[^gT\f T\ ]S[ WXTfT\^a \W`[U ^    VSTcS T\eWX_U ]S[ \[V ]^UY aWc^]TW\h e ^ ]^UY eXW_ ^ fXT` mWl  \`U \W \[V SWU]n ]S[ VSWa[ mWl TU UdUZ[\`[`h RS[X[ c^\ l[ ^ V^T]T\f ]T_[ ]W U]^X] \[V aWc^a mWlUn ^U ]S[ ]^UYU eXW_ ]S[ fXT` c^\\W] l[ _Wg[` VSTa[ ]S[j ^X[ cW__d\Tc^]T\fh e ^ ZXW{ fX^__T\f _W`[a aTY[  }  x z VT]S U_^aa UdZ[X U][ZU TU dU[`n ]STU V^T]T\f ]T_[ USWda` \W] l[ a^Xf[h RW UT_ZaTej ]S[ ZXWla[_ V[ ^UUd_[ ^  b[` cWU] ZXWZWX{ ]TW\^a ]W ]S[ \d_l[X We ]^UYU ]W l[ ]X^\Ue[X[`h k[ ^aUW ZXWgT`[ ^ `TU]XTld][` _[cS^\TU_ eWX _TfX^]TW\h

K rOuN

RS[ cadU][XU ^X[ T\][XcW\\[c][` ^\` ]S[ fXT` UcS[`{ da[X ]^Y[U c^X[ We UW_[ mWlUh RS[ mWlU Udl_T]][` lj ]S[ fXT` UcS[`da[X c^\ l[ [b[cd][` T\ U[g[X^a `Te{ e[X[\] UT][Uh |WV[g[Xn ]S[ `Tw[X[\] UT][U S^g[ ]W l[ ^`m^c[\]n ]VW{lj{]VWn ^\` ^\ Wg[XS[^` S^U ]W l[ cW\UT`[X[`h k[ cW\UT`[X W\aj ^  b[` Wg[XS[^` eWX _da]T{UT][ [b[cd]TW\n [g[\ Te ]S[X[ ^X[ _WX[ ]S^\ ]VW UT][U T\gWag[`h RSTU TU X[^UW\^la[ W\ cW__d\Tc^]TW\ Z^]][X\U aTY[ cW_Za[][ [bcS^\f[ VS[X[ ]S[ UaWV[U] aT\Y USWda` l[ ]S[ WXTfT\ We ]S[ a^Xf[X Wg[XS[^` x zh kT]S ^ _WX[ cW_Za[b ^aaWc^]TW\ UcS[_[ ]STU TU \W aW\f[X ]Xd[h |WV[g[Xn ]W  \` ^ fWW` [_l[``T\f We ^ Z^X^aa[a ^ZZaTc^]TW\ TU ^ `T†cda] ZXWla[_h vU ]S[ fTg[\ fX^ZS c^\ S^g[ ^ a^Xf[ \d_l[X We g[X]Tc[Un ^ c[\]X^aT‰[` cW\]XWa ^\` _W\T]WXT\f We ^aa aWc^a cadU][XU ^c]TgT]T[U TU `T†cda]h }Wn V[ ZXWZWU[ ]S[ eWaaWVT\f _[cS^\TU_ W\ [^cS cadU][X… y„ ^cS cadU][X UcS[`da[X _^T\]^T\U T]U WV\ –d[d[ We Udl_T]][` mWlUh ^cS mWl S^U T]U ZXWc[UUT\f X[{ –dTX[_[\]Uh vUUWcT^][` ]W [^cS mWl V[ S^g[ ^aUW T]U

[U]T_^][` ZXWc[UUT\f ]T_[‘ €„ ŠWX [^cS aWc^a UcS[`da[Xn ]S[  XU] mWl T\ ]S[ –d[d[ TU ^\^aj‰[`h e ]STU mWl c^\ l[ [b[cd][` W\ ]S[ cadU{ ][Xn ]S[ UcS[`da[X ^aaWc^][U ]S[ mWlh i]S[XVTU[n ]S[X[ ^X[ ]SX[[ ZWUUTlTaT]T[U… ~y„ ]S[ mWl c^\ l[ [b[cd][` VT]ST\ ]T_[   n Th[hn W\[ WX _WX[ We ]S[ mWlU T\ [b[{ cd]TW\ VTaa  \TUS UWW\n ~€„ ^ fXT` mWl Xd\\T\f W\ ]S[ cadU][X c^\ _TfX^][ eX[[T\f ]S[ \[c[UU^Xj ZXWc[UUWXUn ^\` ~ƒ„ ]S[ mWl TU U[\] ]W ]S[ fXT` UcS[`da[X‘ ƒ„ RW _TfX^][ ^ fXT` mWln ^aa We T]U ]^UYU S^g[ ]W l[ UdUZ[\`[`h RS[\n ]S[ aWc^a UcS[`da[X VTaa cS[cY ]S[ ^g^Ta^lTaT]j We ZXWc[UUWXU W\ T]U \[TfSlWXU ~]S[ cW_{ _d\Tc^]TW\ TU `W\[ VT]SWd] ]S[ Z^X]TcTZ^]TW\ We ]S[ fXT` UcS[`da[X„h e ]S[X[ TU ^ \[TfSlWX VT]S [\WdfS eX[[ ZXWc[UUWXUn ]S[ mWl ]^UYU ^X[ ]X^\Ue[X[`h i]S{ [XVTU[ ]S[ fXT` mWl TU U]WZZ[` ^\` U[\] l^cY ]W ]S[ fXT` UcS[`da[X‘ ‡„ v fXT` mWl WX ^ X[fda^X mWl c^\ l[ U]WZZ[` Te T]U cdXX[\] [b[cd]TW\ ]T_[ TU UTf\T c^\]aj a^Xf[X ]S^\ ]S[ ZX[`Tc][` ]T_[‘ ˆ„  [XTW`Tc^aajn ]S[ UcS[`da[X U[\`U T]U U]^]dU ]W ]S[ fXT` UcS[`da[Xh RS[ fXT` UcS[`da[X S^U ]VW ZXTWXT]j –d[d[Un W\[ eWX \[V Udl_TUUTW\U ~  „n ^\` ^\W]S[X eWX Udl_TU{ UTW\U T\ ZXWfX[UUn   ~]S^] V[X[ U]WZZ[` lj _TfX^{ ]TW\„h y„ e ]S[ Udl_TUUTW\ T\ ZXWfX[UU –d[d[ ~  „ TU \W] [_Z]jn ]S[ fXT` UcS[`da[X  \`U ~Te T] [bTU]U„ ^ U[] We ^`m^c[\] cadU][XU ]W cW\]T\d[ ]S[ [b[cd]TW\ We ]S[  XU] mWl T\ ]S[ –d[d[h i]S[XVTU[n ]S[ fXT` UcS[`da[X  \`U ^ c^\`T`^][ mWl W\ ]S[ \[V Udl_TUUTW\U –d[d[ ~  „‘ €„ e ^aa ]S[ cSWU[\ ZXWc[UUWXU W\ ]S[ cadU][XU ^X[ ^g^Ta^la[n ]S[ mWl TU U[\] ]W ]S[_h i]S[XVTU[n ]S[ ZX[gTWdU T][_ TU X[Z[^][` d\]Ta ^ c^\`T`^][ TU eWd\`‘ ƒ„  [XTW`Tc^aajn ]S[ fXT` UcS[`da[X X[c[Tg[U ]S[ U]^]dU eXW_ aWc^a UcS[`da[XUh 

Kq p  ŽŽqNPNurq  Or  rMP

RS[ T`[^ TU ]W ZXWZWU[ ^ UT_Za[ ^``{W\ _T``a[V^X[ ]W ZXWgT`[ fXT` e^cTaT]T[U ]W T\][XcW\\[c] T\`[Z[\`[\] cadU][XUh ŠWX [^cS cadU][Xn V[ W\aj \[[` ^ U_^aa `^[{ _W\ VSTcS cW__d\Tc^][U VT]S ]S[ fXT` UcS[`da[Xn VSTcS USWda` l[ ^la[ ]W S^\`a[ U[g[X^a X[–d[U]U ^] ]S[ U^_[ ]T_[h RSTU `^[_W\ cW\]^T\U ]SX[[ cW_ZW{ \[\]U… \[TfSlWXSWW` T\eWX_^]TW\ ~ „n ^ _W\T]WXn ^\` ^ UcS[`da[X ~U[[ ŠTfdX[ y„h RS[ `^[_W\U USWda` T\eWX_ Z[XTW`Tc^aaj ]S[ ^g^Ta^lTaT]j We ZXWc[UUWXU T\ [^cS cadU][Xn _WX[Wg[Xn ]S[ aWc^a UcS[`da[XU c^\ ^aUW

U[\` mWlU ]W l[ ZXWc[UU[` lj ]S[ fXT` UcS[`da[Xh i\ ]S[ W]S[X UT`[n ]S[ fXT` UcS[`da[X c^\ ^aUW cS[cY ]S[ cdXX[\] ^g^Ta^lTaT]j We ^ fXWdZ We cadU][XU ~lj ]S[ fXT` cW\`T]TW\U cW_ZW\[\]„ ^\` U[\` ]^UYU ]W ]S[ aWc^a UcS[`da[XU ~lj ]S[ ^aaWc^]WXn ^ccWX`T\f ]W ]S[ ^g^Ta^lTaT]j„h ŠT\^aajn ]S[X[ USWda` l[ ^ _[cS^\TU_ VSTcS ^aaWVU ]S[ ]^UYU We ^ Z^X^aa[a ^ZZaTc^]TW\ ]W l[ _TfX^][` ~]STU TU ^\W]S[X aT\[ We X[U[^XcS T\ \][{ fX^`[ xƒz„h grid controller NJ queue grid conditions


cluster NI

CJ queue

cluster avail. join leave

monitor scheduler

. . .


avail. join leave

monitor scheduler

ŠTfdX[ y…  XWZWU^a eWX ]S[ ‚XT` vXcST][c]dX[h RS[ fXT` UcS[`da[X TU _WX[ cW_Za[bh ] S^U ]W _^T\]^T\ ]S[ aTU] We ^g^Ta^la[ ZXWc[UUWXU T\ \[TfS{ lWXT\f cadU][XU‘ ]STU c^\ l[ `W\[ dUT\f UW_[ ZX[{ ZXWc[UUT\f ][cS\T–d[U T\ WX`[X ]W  \` ]S[ caT–d[U ~cW_Za[][ Udl{fX^ZSU„ W\ ]S[ fX^ZS eWX_[` lj ^aa cadU][XUh v\W]S[X cS^X^c][XTU]Tc We ]S[ _W`[a TU ]S[ ZWUUT{ lTaT]j ]W mWT\ ^\` a[^g[ ]S[ fXT` `j\^_Tc^aajh ŠWX mWT\T\f ]S[ fXT`n T] TU W\aj \[c[UU^Xj ]W Xd\ ]S[ `^[{ _W\n T\eWX_ ]S[ ZXWc[UUWXU ^g^Ta^lTaT]jn ^\` ZXWgT`[ VSTcS ^X[ ]S[ ^`m^c[\] cadU][XUh i\ ]S[ W]S[X UT`[n ]W a[^g[ ]S[ fXT`n ]S[ cadU][X S^U ]W U[\` ^ UTf\^a ]W ]S[ _W\T]WX VSTcS U[\`U UTf\^aU ]W ]S[ fXT` ^Z{ ZaTc^]TW\U Xd\\T\f W\ T]n ^\` V^T] eWX ]S[TX _TfX^{ ]TW\h ŠWX ]S[ _TfX^]TW\n ]S[ \[TfSlWXSWW` T\eWX{ _^]TW\ ~ „ TU cW\Uda][` T\ WX`[X ]W  \` ^g^Ta^la[ ZXWc[UUWXU W\ ]S[ ^`m^c[\] cadU][XUh e ]S[ \d_l[X We ZXWc[UUWXU TU T\Ud†cT[\]n ]S[ fXT` mWl TU U]WZZ[` ^\` U[\] l^cY ]W ]S[ fXT` ^aaWc^]WXh ve][X ]S[ _TfX^{ ]TW\n W\aj ^ aTfS]V[TfS] `^[_W\ ^c]T\f ^U ^ ZXWbj VTaa U]^j ^aTg[ d\]Ta ]S[ [\` We ]S[ fXT` ^ZZaTc^]TW\h ŠWX ^ a[UU [bTla[n ld] U]Taa `j\^_Tc fXT` [\gTXW\{ _[\]n ^ a[^U[ ZWaTcj c^\ l[ dU[`h \ ]STU c^U[n ]S[ cadU][X _W\T]WX TU X[UZW\UTla[ eWX ]S[ a[^U[ ZWaTcjh \U][^` We ^aaWVT\f cadU][XU ]W a[^g[ ]S[ fXT` ^] ^\j _W_[\]n VS[\ mWT\T\f ]S[ fXT` ]S[ cadU][X ^`_T\{ TU]X^]WX c^\ ^aUW ZXWgT`[ T]U ]T_[ ^g^Ta^lTaT]jh RSTU

]T_[ ^g^Ta^lTaT]j c^\ l[ X[\[V[` Te ]S[ cadU][X c^\ U]^j T\ ]S[ fXT` ^e][X ]S[ [\` We ]S[ fTg[\ ]T_[ Z[{ XTW`h v ZXWZWU^a We ^\ ^XcST][c]dX[ c^\ l[ U[[\ W\ ŠTfdX[ yh 


\ ]STU Z^Z[X V[ U]d`T[` ]S[ ZXWZWU^a We ^ \[V _W`[a ]W ^aaWV ]S[ [b[cd]TW\ We Z^X^aa[a ^ZZaTc^]TW\U T\ ^ `j\^_Tc fXT` [\gTXW\_[\]h RS[ _W`[a ZXWgT`[U Z^{ X^_[][XU ]W _[^UdX[ ]S[ Wg[XS[^` ]T_[ ]W US^X[ ^ mWl ^_W\f `Tw[X[\] cadU][XUn ^\` ]W cW\UT`[X Z^X^aa[a ]^UYU _TfX^]TW\ cWU]h k[ ^aUW ZXWZWU[ ^\ ^XcST][c{ ]dX[ eWX ]S[ T_Za[_[\]^]TW\h RW cW\]T\d[ ]STU VWXY V[ T\][\` ]W [bZaWX[ ]S[ `Te{ e[X[\] ZWUUTlTaT]T[U We ]S[ _W`[a ]SXWdfS _WX[ [a^l{ WX^][` UT_da^]TW\Uh \T]T^a UT_da^]TW\U X[Uda]U c^\ l[ eWd\` W\ ]S[ [b][\`[` g[XUTW\ We ]STU `Wcd_[\] T\ xƒzh k[ ^aUW T\][\` ]W U]d`j _WX[ _[cS^\TU_U eWX _TfX^]T\f ]^UYU We ^ Z^X^aa[a mWln ^\` ]W T_Za[{ _[\] ]S[ ZXWZWU[` ^XcST][c]dX[ T\ WdX cW_Zd]T\f [\gTXW\_[\]h Ž ŽOŽqQŽM


