Grafikkort till parallella beräkningar
2012 (Svenska)Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hp
Studentuppsats (Examensarbete)
Abstract [sv]
Den här studien beskriver hur grafikkort kan användas på en bredare front än
multimedia. Arbetet förklarar och diskuterar huvudsakliga alternativ som finns
till att använda grafikkort till generella operationer i dagsläget. Inom denna studie
används Nvidias CUDA arkitektur. Studien beskriver hur grafikkort används
till egna operationer rent praktiskt ur perspektivet att vi redan kan programmera
i högnivåspråk och har grundläggande kunskap om hur en dator fungerar. Vi
använder s.k. accelererade bibliotek på grafikkortet (THRUST och CUBLAS) för
att uppnå målet som är utveckling av programvara och prestandatest. Resultatet
är program som använder GPU:n till generella och prestandatest av dessa,
för lösning av olika problem (matrismultiplikation, sortering, binärsökning och
vektor-inventering) där grafikkortet jämförs med processorn seriellt och parallellt.
Resultat visar att grafikkortet exekverar upp till ungefär 50 gånger snabbare
(tidsmässigt) kod jämfört med seriella program på processorn.
Abstract [en]
This study describes how we can use graphics cards for general purpose computing
which differs from the most usual field where graphics cards are used, multimedia.
The study describes and discusses present day alternatives for using
graphic cards for general operations. In this study we use and describe Nvidia
CUDA architecture. The study describes how we can use graphic cards for general
operations from the point of view that we have programming knowledge
in some high-level programming language and knowledge of how a computer
works. We use accelerated libraries (THRUST and CUBLAS) to achieve our goals
on the graphics card, which are software development and benchmarking. The
results are programs countering certain problems (matrix multiplication, sorting,
binary search, vector inverting) and the execution time and speedup for
these programs. The graphics card is compared to the processor in serial and
the processor in parallel. Results show a speedup of up to approximatly 50 times
compared to serial implementations on the processor.
Ort, förlag, år, upplaga, sidor
Malmö högskola/Teknik och samhälle , 2012. , s. 30
Nyckelord [sv]
Nvidia CUDA, THRUST, CUBLAS, Eigen, OpenMP, accelererade bibliotek, prestandatest, GPU, CPU, vektor inventering, sortering, binärsökning, matrismultiplikation
Nationell ämneskategori
Teknik och teknologier
Identifikatorer
URN: urn:nbn:se:mau:diva-20150Lokalt ID: 16799OAI: oai:DiVA.org:mau-20150DiVA, id: diva2:1480018
Utbildningsprogram
TS Data- och telekom - Teknik, ekonomi och ledarskap, TELMah
2020-10-272020-10-272022-06-27Bibliografiskt granskad