Klusteranalys av cykelflödesdata för identifiering av viktiga faktorer och avvikande datapunkter
2019 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE credits
Student thesis
Abstract [sv]
Studien har för avsikt att förbättra kunskapen om vilka faktorer som påverkar cykelflödet
en viss dag i Malmö. Vi har huvudsakligen undersökt frågor om, hur många grupperande
kluster är optimalt för att kunna identifiera avvikande dagar och vilka är dess faktorer
i en tidsserie cykelvolymdata? Vår arbetsmetod var att använda ett matchande tillvägagångssätt baserat på ett experiment tillsammans med en utvärderingsmetod. Arbetsmetoden skedde i en iterativ process där experimentet var att hitta rätt antal kluster och
där utvärderingen var analysen av resultaten som producerades av experimentet. Datan
erhållen från en cykelräknare belägen på Kaptensgatan i Malmö fick databearbetas med
hjälp av normalisering då volymen av cyklister inte ska ha någon påverkan i studien. Syftet
med vårt arbete är att kunna identifiera avvikande datapunkter och dess faktorer med stor
inverkan på cykelflöden med hjälp av klusteranalys då detta kan leda till mer välinformerade beslut vid stads- och transportplanering. Om det gick att analysera cyklister där dessa
faktorer elimineras så skulle detta leda till vidare utveckling och forskning av stor betydelse
för Malmö stad. Genom att använda oss av klusteranalysen K-means och Euklidisk distans
som används som beräkning av distanser inom liknande områden kunde vi finna relevanta
kluster med avvikande datapunkter och faktorer med stor inverkan på cykelflödet. Vårt
resultat visar att 7 kluster varav 2 av de delades upp till 6 mindre kluster, var det mest optimala för studien och faktorerna med en stor inverkan på de antal registrerade cyklisterna
under vissa dagar kunde då identifieras bäst. Faktorerna som identifierades var evenemang,
festivaler, fotbollsmatcher, konserter, lovdagar, nederbörd och röda dagar.
Abstract [en]
This study aims to provide a deeper understanding of the different factors and their impact
on the bicycle flow in Malmö during a certain day. We mainly examined the questions,
what is the most optimal number of clusters needed in order to identify discrepancies, and
which key factors have huge impact in a dataset? The choice of the method used in this
study is a matching approach based on experiment together with an evaluation method.
The work method occurred in an iterative process, where the experiment was conducted
to find the right number of clusters and the evaluation was the analysing of the results
that were produced by the experiment. The collected data from a bicycle counter, located
in Kaptensgatan in Malmö, had to be processed with normalization to ensure that the
volume of the bicycles does not affect the study. The purpose of our study is to identify
discrepancies and key factors that have huge implications on the bicycle flow with the
help of cluster analysis that might lead to more well-informed decision in urban planning
and transportation planning. If it were possible to analyze cyclists where these factors
are eliminated, this would lead to further development and research of great importance
for Malmö City. By using the cluster algorithm K-means, and Euclidean distance, which
is used as calculation of distances in similar areas, we could then find relevant clusters
with deviating data points and key factors with great impact on the bicycle flow. Our
results shows that 7 clusters, 2 of which were divided up to 6 smaller clusters, were the
most optimal for the study and the factors with a large impact on the number-registered
cyclists during certain days could then be best identified. The factors identified were
events, festivals, football matches, concerts, rainfalls and holidays.
Place, publisher, year, edition, pages
Malmö universitet/Teknik och samhälle , 2019. , p. 60
Keywords [sv]
Klusteranalys, K-Means, Cykeldata, Maskininlärning
National Category
Engineering and Technology
Identifiers
URN: urn:nbn:se:mau:diva-20744Local ID: 29101OAI: oai:DiVA.org:mau-20744DiVA, id: diva2:1480624
Educational program
TS Datateknik och mobil IT
Supervisors
Examiners
2020-10-272020-10-27Bibliographically approved