커버곡 검색을 위한 멀티스케일 2D-FTM과 n-gram을 이용한 크로마 특징 축약

We proposed a chroma feature sequence abstraction method that can, when compared with conventional methods, improve the speed of cover song identification methods so that it can be used in large-scale music identification services. The proposed method represents the chroma feature sequence, which is...

Full description

Saved in:
Bibliographic Details
Published in정보과학회 컴퓨팅의 실제 논문지 Vol. 24; no. 6; pp. 318 - 323
Main Authors 김정현(Junghyun Kim), 박지현(Jihyun Park), 유원영(Wonyoung Yoo), 서진수(Jinsoo Seo)
Format Journal Article
LanguageKorean
Published Korean Institute of Information Scientists and Engineers 2018
한국정보과학회
Subjects
Online AccessGet full text
ISSN2383-6318
2383-6326
DOI10.5626/KTCP.2018.24.6.318

Cover

Abstract We proposed a chroma feature sequence abstraction method that can, when compared with conventional methods, improve the speed of cover song identification methods so that it can be used in large-scale music identification services. The proposed method represents the chroma feature sequence, which is proportional to the length of music, in fixed length feature vectors using multiscale 2D-FTM (two-dimensional Fourier-transform magnitude) and chroma n-gram. It facilitates indexing and simplifies distance comparison to improve identification speed. The abstracted chroma vector maintains the global and local characteristics of the chroma feature sequence, making it more robust to the tempo change, transposition, and remake versions of a song. We experimented using public datasets and large-scale datasets collected from the YouTube website in order to verify the performance of the proposed method, and we confirmed that search speed was improved while maintaining the cover song identification performance. 본 논문은 대규모의 커버곡 식별 서비스에 적용할 수 있도록 기존의 방법에 비해 커버곡 식별속도를 개선할 수 있는 크로마 특징 수열 축약 방법을 제안한다. 음악의 길이에 따라 길이가 비례하는 크로마 특징 수열을 멀티스케일 2D-FTM(Two Dimensional Fourier Transform Magnitude)과 크로마 n-gram을 이용해 고정 길이의 특징벡터 형태로 표현함으로써 인덱싱을 용이하게 하고 거리비교를 단순화하여 식별 속도를 개선하였다. 축약된 크로마 벡터는 오디오 프레임 단위의 크로마 특징 수열의 전체적인 특징과 국지적인 특징을 유지하여 커버곡 간의 템포 변화와 조옮김, 리메이크 버전에 강인하도록 하였다. 제안된 방법의 성능 검증을 위해서 공개 데이터셋 및 유투브 웹사이트에서 자체 수집한 대규모 데이터에서 실험을 수행하여 커버곡 식별 성능을 유지하면서 검색 속도가 개선됨을 확인하였다.
AbstractList We proposed a chroma feature sequence abstraction method that can, when compared with conventional methods, improve the speed of cover song identification methods so that it can be used in large-scale music identification services. The proposed method represents the chroma feature sequence, which is proportional to the length of music, in fixed length feature vectors using multiscale 2D-FTM (two-dimensional Fourier-transform magnitude) and chroma n-gram. It facilitates indexing and simplifies distance comparison to improve identification speed. The abstracted chroma vector maintains the global and local characteristics of the chroma feature sequence, making it more robust to the tempo change, transposition, and remake versions of a song. We experimented using public datasets and large-scale datasets collected from the YouTube website in order to verify the performance of the proposed method, and we confirmed that search speed was improved while maintaining the cover song identification performance. 본 논문은 대규모의 커버곡 식별 서비스에 적용할 수 있도록 기존의 방법에 비해 커버곡 식별속도를 개선할 수 있는 크로마 특징 수열 축약 방법을 제안한다. 음악의 길이에 따라 길이가 비례하는 크로마 특징 수열을 멀티스케일 2D-FTM(Two Dimensional Fourier Transform Magnitude)과 크로마 n-gram을 이용해 고정 길이의 특징벡터 형태로 표현함으로써 인덱싱을 용이하게 하고 거리비교를 단순화하여 식별 속도를 개선하였다. 축약된 크로마 벡터는 오디오 프레임 단위의 크로마 특징 수열의 전체적인 특징과 국지적인 특징을 유지하여 커버곡 간의 템포 변화와 조옮김, 리메이크 버전에 강인하도록 하였다. 제안된 방법의 성능 검증을 위해서 공개 데이터셋 및 유투브 웹사이트에서 자체 수집한 대규모 데이터에서 실험을 수행하여 커버곡 식별 성능을 유지하면서 검색 속도가 개선됨을 확인하였다.
본 논문은 대규모의 커버곡 식별 서비스에 적용할 수 있도록 기존의 방법에 비해 커버곡 식별 속도를 개선할 수 있는 크로마 특징 수열 축약 방법을 제안한다. 음악의 길이에 따라 길이가 비례하는 크로마 특징 수열을 멀티스케일 2D-FTM(Two Dimensional Fourier Transform Magnitude)과 크로마n-gram을 이용해 고정 길이의 특징벡터 형태로 표현함으로써 인덱싱을 용이하게 하고 거리비교를 단순화하여 식별 속도를 개선하였다. 축약된 크로마 벡터는 오디오 프레임 단위의 크로마 특징 수열의 전체적인 특징과 국지적인 특징을 유지하여 커버곡 간의 템포 변화와 조옮김, 리메이크 버전에 강인하도록 하였다. 제안된 방법의 성능 검증을 위해서 공개 데이터셋 및 유투브 웹사이트에서 자체 수집한 대규모 데이터에서 실험을 수행하여 커버곡 식별 성능을 유지하면서 검색 속도가 개선됨을 확인하였다. We proposed a chroma feature sequence abstraction method that can, when compared with conventional methods, improve the speed of cover song identification methods so that it can be used in large-scale music identification services. The proposed method represents the chroma feature sequence, which is proportional to the length of music, in fixed length feature vectors using multiscale 2D-FTM (two-dimensional Fourier-transform magnitude) and chroma n-gram. It facilitates indexing and simplifies distance comparison to improve identification speed. The abstracted chroma vector maintains the global and local characteristics of the chroma feature sequence, making it more robust to the tempo change, transposition, and remake versions of a song. We experimented using public datasets and large-scale datasets collected from the YouTube website in order to verify the performance of the proposed method, and we confirmed that search speed was improved while maintaining the cover song identification performance. KCI Citation Count: 0
Author 서진수(Jinsoo Seo)
김정현(Junghyun Kim)
박지현(Jihyun Park)
유원영(Wonyoung Yoo)
Author_xml – sequence: 1
  fullname: 김정현(Junghyun Kim)
– sequence: 2
  fullname: 박지현(Jihyun Park)
– sequence: 3
  fullname: 유원영(Wonyoung Yoo)
– sequence: 4
  fullname: 서진수(Jinsoo Seo)
BackLink https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002353746$$DAccess content in National Research Foundation of Korea (NRF)
BookMark eNpF0M1KAlEYBuBDFGTWDbSaTYsWM53fmTNL0SzTMmL2p_mVQR1jphbtjFyUrd2ELgRBhBZhEUR2Q3q8hyyjVu-7eHg_-DbAatSIfAC2EdSYjvW9opU91TBEXMNU0zWC-ApIYcKJqhOsr_51xNfBVpKEDsSIY8pNlALn8mMwG7emL31lOm7K23vZaymy25p3usps1Jw_PMv2QE6asjdRcE7NW8fTl4kSqZXYrv_Q3qt8HH3r-c3TrN-dDe-UeftdDjuKfOvIzucmWAvsWuJv_WYaWPl9K3uolsoHhWympFZNilTqMM4dTN1A97jPPYgMwiByXRNxGkDPC3zqUsw8g0KXOQjpEDs2447DDMKxS9JgdzkbxYGouqFo2OFPVhqiGovMmVUQ1MCmSY2F3VnaaphchiLykpo4yhTL3y_ExGSYYn1x_99FV3FY973QFheLYsfX4qSc24cGZZQYiHwBSwuJrg
ContentType Journal Article
DBID DBRKI
TDB
JDI
ACYCR
DEWEY 005
DOI 10.5626/KTCP.2018.24.6.318
DatabaseName DBPIA - 디비피아
Nurimedia DBPIA Journals
KoreaScience
Korean Citation Index
DatabaseTitleList

DeliveryMethod fulltext_linktorsrc
Discipline Computer Science
DocumentTitleAlternate Chroma Feature Abstraction using Multiscale 2D-FTM and N-gram for Cover Song Search
DocumentTitle_FL Chroma Feature Abstraction using Multiscale 2D-FTM and N-gram for Cover Song Search
EISSN 2383-6326
EndPage 323
ExternalDocumentID oai_kci_go_kr_ARTI_4729947
JAKO201823952426173
NODE07454371
GroupedDBID .UV
ALMA_UNASSIGNED_HOLDINGS
DBRKI
TDB
JDI
ACYCR
M~E
ID FETCH-LOGICAL-k941-4b588b24cf6d8e8d0173501cc9184f0ddfe4c425d740c5b11602ba58bb57382c3
ISSN 2383-6318
IngestDate Tue Nov 21 21:27:34 EST 2023
Fri Dec 22 11:58:53 EST 2023
Thu Feb 06 13:28:49 EST 2025
IsDoiOpenAccess true
IsOpenAccess true
IsPeerReviewed false
IsScholarly false
Issue 6
Keywords 커버곡 식별
크로마 특징
cover song identification
feature abstraction
음악 검색
음악 유사도
Chroma feature
특징 축약
music search
music similarity
Language Korean
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-k941-4b588b24cf6d8e8d0173501cc9184f0ddfe4c425d740c5b11602ba58bb57382c3
OpenAccessLink http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201823952426173&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01
PageCount 6
ParticipantIDs nrf_kci_oai_kci_go_kr_ARTI_4729947
kisti_ndsl_JAKO201823952426173
nurimedia_primary_NODE07454371
PublicationCentury 2000
PublicationDate 2018
PublicationDateYYYYMMDD 2018-01-01
PublicationDate_xml – year: 2018
  text: 2018
PublicationDecade 2010
PublicationTitle 정보과학회 컴퓨팅의 실제 논문지
PublicationTitleAlternate KIISE transactions on computing practices
PublicationYear 2018
Publisher Korean Institute of Information Scientists and Engineers
한국정보과학회
Publisher_xml – name: Korean Institute of Information Scientists and Engineers
– name: 한국정보과학회
SSID ssib021824891
ssib044742771
ssib053377435
ssib019653237
Score 1.6436224
Snippet We proposed a chroma feature sequence abstraction method that can, when compared with conventional methods, improve the speed of cover song identification...
본 논문은 대규모의 커버곡 식별 서비스에 적용할 수 있도록 기존의 방법에 비해 커버곡 식별 속도를 개선할 수 있는 크로마 특징 수열 축약 방법을 제안한다. 음악의 길이에 따라 길이가 비례하는 크로마 특징 수열을 멀티스케일 2D-FTM(Two Dimensional Fourier...
SourceID nrf
kisti
nurimedia
SourceType Open Website
Open Access Repository
Publisher
StartPage 318
SubjectTerms 컴퓨터학
Title 커버곡 검색을 위한 멀티스케일 2D-FTM과 n-gram을 이용한 크로마 특징 축약
URI https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE07454371
http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201823952426173&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01
https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002353746
Volume 24
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 정보과학회 컴퓨팅의 실제 논문지, 2018, 24(6), , pp.318-323
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR1NT9RAtEE86MVvI36QxjinTddtZ9rOHNvuEoQAHtaEW91-GbJmMQgXDwYjB8XzXgwcSEgIiQcDxMSIf4jt_gffm-mWBkn8uHRfp--r7-30vdfOh6Y9Su3ITRoiM1wncg1GXdPgdscxIPRmKTU7EGRwgvPcvDP9jM0s2otjF44qo5bWVqN6_ObceSX_41VoA7_iLNl_8GzJFBoABv_CETwMx7_yMWkFxPeJx0jLJ75FOAAe8SnxzJqE5EAGQOKUcIGAaAJSTUKBRG8SYQNcQw6ekOiAAtwUnSeZg5Sg4AQM_KBmNY2p9lwhDM57Bg7yOiMAMCWt8JBzRRKgmMQLpEgTFUHAJZyra8BU6gpNwpasfAdpkZVN_GY1n5Z4DXnVl7qwUqmRRCXaIzyo1wqD-erGwU5cSoSbswuVBZdI3C9uHJkr6wCKr1QFHrxQkJdfe6RcUVipUAnZEc5OUaRd1a1I4nNQpGc8ZWufCAUAillFAc-h2RQXqSfnRO2zPXqFU403kDBRw6FFU1ptUwsJjIKUmmhedMZqxClp1ZmavH02LkKSi69oZtvBUxzNyOsWqzv1krS6CPmZ5KAcsjnjzS4gqUWFjWmd6dIL2kXLdU0cSDv3tjV6iuMSlbSyAhJuEcD46YpMjLkMyUbnUG9ACSJ3wi2toWa3odaPf9cZykisrZYgG-ytQBJ5qbeGO2HA47SSGbavaVeKkk73VP-8ro11l29oV0fbpehF9LypPc9_7A4ONk4Od_STg_X8_cd8e0PPtzaG_S19sL8-_PQ139zNj9fz7WNddbCTw2NddS2Jun2Uf95H7OG7L4OdrcHeB324-T3f6-v5t37e_3lLa0-12sG0UWxwYnQFMw0W2ZxHFoszJ-EpTyA44mf-OBYmZ1kjSbKUxRBTE5c1YjsyTadhRR2bR5HtUm7F9LY23lvupXc0HQJ1lIm0kbjUYZlIeMd2UsvKKHeyRhrRCW1S2izsJa9fhuf4ckJ7CMYMu_FSiAvO4--L5bC7EkJZ_SRkUIIL5gKX0tbhK7UaTji_0GxBHWLjc_7un8Tc0y5ji3qHeV8bX11ZSx9AVr8aTco_0S8FG8QX
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%EC%BB%A4%EB%B2%84%EA%B3%A1+%EA%B2%80%EC%83%89%EC%9D%84+%EC%9C%84%ED%95%9C+%EB%A9%80%ED%8B%B0%EC%8A%A4%EC%BC%80%EC%9D%BC+2D-FTM%EA%B3%BC+n-gram%EC%9D%84+%EC%9D%B4%EC%9A%A9%ED%95%9C+%ED%81%AC%EB%A1%9C%EB%A7%88+%ED%8A%B9%EC%A7%95+%EC%B6%95%EC%95%BD&rft.jtitle=%EC%A0%95%EB%B3%B4%EA%B3%BC%ED%95%99%ED%9A%8C.+%EC%BB%B4%ED%93%A8%ED%8C%85%EC%9D%98+%EC%8B%A4%EC%A0%9C+%EB%85%BC%EB%AC%B8%EC%A7%80&rft.au=%EA%B9%80%EC%A0%95%ED%98%84&rft.au=%EB%B0%95%EC%A7%80%ED%98%84&rft.au=%EC%9C%A0%EC%9B%90%EC%98%81&rft.au=%EC%84%9C%EC%A7%84%EC%88%98&rft.date=2018&rft.issn=2383-6318&rft.eissn=2383-6326&rft.volume=24&rft.issue=6&rft.spage=318&rft.epage=323&rft_id=info:doi/10.5626%2FKTCP.2018.24.6.318&rft.externalDBID=n%2Fa&rft.externalDocID=JAKO201823952426173
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2383-6318&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2383-6318&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2383-6318&client=summon