Stap 2: Welke taak het versnellen?
Voer de netwerkoplossing Beowulf...
In de optimale classificatieproces bestaat een behoefte om te tellen van duplicaten in elke multiset. Voor problemen zoals mij watertje trying voor het oplossen van de multiset wat formaat schandalig. Deel van een multiset dat moest worden geteld is hieronder weergegeven...
Omdat de segmentgrootte kan ook veel groter dan het gedeelte hieronder een type van de variabele index dubbele precisie is meestal vereist naast de matrix wordt dubbele precisie type ook. Verhogen van de matrixindex dan is wat kost zoveel tijd terwijl de matrix zelf is verantwoordelijk voor de noodzaak om te maximaliseren geheugen... .
Door de taak opsplitsen in kleinere segmenten en het toewijzen van elk segment aan locaties of knooppunten op andere berekent hoe sneller het proces van vergelijking en dubbele tellen kan.
Een deel van één segment van waarden worden vergeleken en duplicaten geteld wordt hieronder weergegeven. .
1116642534732
600272059440
738555848598
1324220299720
1282170772552
406100332736
1443470060825
1127113699913
242098093032
1587858021259
1371440052986
120608508586
1885859489440
1614337503910
1848669946193
92056035995
574605286121
1301334977149
777374744415
406100332736
868090093135
...
Zodra het segment is verwerkt alleen de resultaten voor het vergelijken en graaf nodig zijn om te worden opgeslagen in dezelfde map, locatie of knooppunt voor ophalen door de Beowulf-clientprogramma.
Met een totaal van 199 knooppunten (alleen beperkt door het aantal bestanden gelijktijdig open onder Visual Basic 6) segmentgrootte aanzienlijk kan worden verminderd en elk verwerkt in onder een halve seconde.
Dit was het prototype taak die het Beowulf-netwerk kan maar één personal computer niet kon oplossen...