Malmö University Publications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Klusteranalys av cykelflödesdata för identifiering av viktiga faktorer och avvikande datapunkter
Malmö University, Faculty of Technology and Society (TS).
Malmö University, Faculty of Technology and Society (TS).
2019 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesis
Abstract [sv]

Studien har för avsikt att förbättra kunskapen om vilka faktorer som påverkar cykelflödet en viss dag i Malmö. Vi har huvudsakligen undersökt frågor om, hur många grupperande kluster är optimalt för att kunna identifiera avvikande dagar och vilka är dess faktorer i en tidsserie cykelvolymdata? Vår arbetsmetod var att använda ett matchande tillvägagångssätt baserat på ett experiment tillsammans med en utvärderingsmetod. Arbetsmetoden skedde i en iterativ process där experimentet var att hitta rätt antal kluster och där utvärderingen var analysen av resultaten som producerades av experimentet. Datan erhållen från en cykelräknare belägen på Kaptensgatan i Malmö fick databearbetas med hjälp av normalisering då volymen av cyklister inte ska ha någon påverkan i studien. Syftet med vårt arbete är att kunna identifiera avvikande datapunkter och dess faktorer med stor inverkan på cykelflöden med hjälp av klusteranalys då detta kan leda till mer välinformerade beslut vid stads- och transportplanering. Om det gick att analysera cyklister där dessa faktorer elimineras så skulle detta leda till vidare utveckling och forskning av stor betydelse för Malmö stad. Genom att använda oss av klusteranalysen K-means och Euklidisk distans som används som beräkning av distanser inom liknande områden kunde vi finna relevanta kluster med avvikande datapunkter och faktorer med stor inverkan på cykelflödet. Vårt resultat visar att 7 kluster varav 2 av de delades upp till 6 mindre kluster, var det mest optimala för studien och faktorerna med en stor inverkan på de antal registrerade cyklisterna under vissa dagar kunde då identifieras bäst. Faktorerna som identifierades var evenemang, festivaler, fotbollsmatcher, konserter, lovdagar, nederbörd och röda dagar.

Abstract [en]

This study aims to provide a deeper understanding of the different factors and their impact on the bicycle flow in Malmö during a certain day. We mainly examined the questions, what is the most optimal number of clusters needed in order to identify discrepancies, and which key factors have huge impact in a dataset? The choice of the method used in this study is a matching approach based on experiment together with an evaluation method. The work method occurred in an iterative process, where the experiment was conducted to find the right number of clusters and the evaluation was the analysing of the results that were produced by the experiment. The collected data from a bicycle counter, located in Kaptensgatan in Malmö, had to be processed with normalization to ensure that the volume of the bicycles does not affect the study. The purpose of our study is to identify discrepancies and key factors that have huge implications on the bicycle flow with the help of cluster analysis that might lead to more well-informed decision in urban planning and transportation planning. If it were possible to analyze cyclists where these factors are eliminated, this would lead to further development and research of great importance for Malmö City. By using the cluster algorithm K-means, and Euclidean distance, which is used as calculation of distances in similar areas, we could then find relevant clusters with deviating data points and key factors with great impact on the bicycle flow. Our results shows that 7 clusters, 2 of which were divided up to 6 smaller clusters, were the most optimal for the study and the factors with a large impact on the number-registered cyclists during certain days could then be best identified. The factors identified were events, festivals, football matches, concerts, rainfalls and holidays.

Place, publisher, year, edition, pages
Malmö universitet/Teknik och samhälle , 2019. , p. 60
Keywords [sv]
Klusteranalys, K-Means, Cykeldata, Maskininlärning
National Category
Engineering and Technology
Identifiers
URN: urn:nbn:se:mau:diva-20744Local ID: 29101OAI: oai:DiVA.org:mau-20744DiVA, id: diva2:1480624
Educational program
TS Datateknik och mobil IT
Supervisors
Examiners
Available from: 2020-10-27 Created: 2020-10-27Bibliographically approved

Open Access in DiVA

fulltext(4015 kB)240 downloads
File information
File name FULLTEXT01.pdfFile size 4015 kBChecksum SHA-512
a1c063f2f56a22e3ac14734d708dfedbeffc2f152a840a58c3780e27c15e664ed593b35764307cfae07b04874f7cea3436ae4c9c185a24dedf1c11da0c61d429
Type fulltextMimetype application/pdf

By organisation
Faculty of Technology and Society (TS)
Engineering and Technology

Search outside of DiVA

GoogleGoogle Scholar
Total: 241 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 145 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf