Grafikkort till parallella beräkningar
2012 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE credits
Student thesis
Abstract [sv]
Den här studien beskriver hur grafikkort kan användas på en bredare front än
multimedia. Arbetet förklarar och diskuterar huvudsakliga alternativ som finns
till att använda grafikkort till generella operationer i dagsläget. Inom denna studie
används Nvidias CUDA arkitektur. Studien beskriver hur grafikkort används
till egna operationer rent praktiskt ur perspektivet att vi redan kan programmera
i högnivåspråk och har grundläggande kunskap om hur en dator fungerar. Vi
använder s.k. accelererade bibliotek på grafikkortet (THRUST och CUBLAS) för
att uppnå målet som är utveckling av programvara och prestandatest. Resultatet
är program som använder GPU:n till generella och prestandatest av dessa,
för lösning av olika problem (matrismultiplikation, sortering, binärsökning och
vektor-inventering) där grafikkortet jämförs med processorn seriellt och parallellt.
Resultat visar att grafikkortet exekverar upp till ungefär 50 gånger snabbare
(tidsmässigt) kod jämfört med seriella program på processorn.
Abstract [en]
This study describes how we can use graphics cards for general purpose computing
which differs from the most usual field where graphics cards are used, multimedia.
The study describes and discusses present day alternatives for using
graphic cards for general operations. In this study we use and describe Nvidia
CUDA architecture. The study describes how we can use graphic cards for general
operations from the point of view that we have programming knowledge
in some high-level programming language and knowledge of how a computer
works. We use accelerated libraries (THRUST and CUBLAS) to achieve our goals
on the graphics card, which are software development and benchmarking. The
results are programs countering certain problems (matrix multiplication, sorting,
binary search, vector inverting) and the execution time and speedup for
these programs. The graphics card is compared to the processor in serial and
the processor in parallel. Results show a speedup of up to approximatly 50 times
compared to serial implementations on the processor.
Place, publisher, year, edition, pages
Malmö högskola/Teknik och samhälle , 2012. , p. 30
Keywords [sv]
Nvidia CUDA, THRUST, CUBLAS, Eigen, OpenMP, accelererade bibliotek, prestandatest, GPU, CPU, vektor inventering, sortering, binärsökning, matrismultiplikation
National Category
Engineering and Technology
Identifiers
URN: urn:nbn:se:mau:diva-20150Local ID: 16799OAI: oai:DiVA.org:mau-20150DiVA, id: diva2:1480018
Educational program
TS Data- och telekom - Teknik, ekonomi och ledarskap, TELMah
2020-10-272020-10-272022-06-27Bibliographically approved