커버곡 검색을 위한 멀티스케일 2D-FTM과 n-gram을 이용한 크로마 특징 축약
We proposed a chroma feature sequence abstraction method that can, when compared with conventional methods, improve the speed of cover song identification methods so that it can be used in large-scale music identification services. The proposed method represents the chroma feature sequence, which is...
Saved in:
Published in | 정보과학회 컴퓨팅의 실제 논문지 Vol. 24; no. 6; pp. 318 - 323 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Korean |
Published |
Korean Institute of Information Scientists and Engineers
2018
한국정보과학회 |
Subjects | |
Online Access | Get full text |
ISSN | 2383-6318 2383-6326 |
DOI | 10.5626/KTCP.2018.24.6.318 |
Cover
Abstract | We proposed a chroma feature sequence abstraction method that can, when compared with conventional methods, improve the speed of cover song identification methods so that it can be used in large-scale music identification services. The proposed method represents the chroma feature sequence, which is proportional to the length of music, in fixed length feature vectors using multiscale 2D-FTM (two-dimensional Fourier-transform magnitude) and chroma n-gram. It facilitates indexing and simplifies distance comparison to improve identification speed. The abstracted chroma vector maintains the global and local characteristics of the chroma feature sequence, making it more robust to the tempo change, transposition, and remake versions of a song. We experimented using public datasets and large-scale datasets collected from the YouTube website in order to verify the performance of the proposed method, and we confirmed that search speed was improved while maintaining the cover song identification performance. 본 논문은 대규모의 커버곡 식별 서비스에 적용할 수 있도록 기존의 방법에 비해 커버곡 식별속도를 개선할 수 있는 크로마 특징 수열 축약 방법을 제안한다. 음악의 길이에 따라 길이가 비례하는 크로마 특징 수열을 멀티스케일 2D-FTM(Two Dimensional Fourier Transform Magnitude)과 크로마 n-gram을 이용해 고정 길이의 특징벡터 형태로 표현함으로써 인덱싱을 용이하게 하고 거리비교를 단순화하여 식별 속도를 개선하였다. 축약된 크로마 벡터는 오디오 프레임 단위의 크로마 특징 수열의 전체적인 특징과 국지적인 특징을 유지하여 커버곡 간의 템포 변화와 조옮김, 리메이크 버전에 강인하도록 하였다. 제안된 방법의 성능 검증을 위해서 공개 데이터셋 및 유투브 웹사이트에서 자체 수집한 대규모 데이터에서 실험을 수행하여 커버곡 식별 성능을 유지하면서 검색 속도가 개선됨을 확인하였다. |
---|---|
AbstractList | We proposed a chroma feature sequence abstraction method that can, when compared with conventional methods, improve the speed of cover song identification methods so that it can be used in large-scale music identification services. The proposed method represents the chroma feature sequence, which is proportional to the length of music, in fixed length feature vectors using multiscale 2D-FTM (two-dimensional Fourier-transform magnitude) and chroma n-gram. It facilitates indexing and simplifies distance comparison to improve identification speed. The abstracted chroma vector maintains the global and local characteristics of the chroma feature sequence, making it more robust to the tempo change, transposition, and remake versions of a song. We experimented using public datasets and large-scale datasets collected from the YouTube website in order to verify the performance of the proposed method, and we confirmed that search speed was improved while maintaining the cover song identification performance. 본 논문은 대규모의 커버곡 식별 서비스에 적용할 수 있도록 기존의 방법에 비해 커버곡 식별속도를 개선할 수 있는 크로마 특징 수열 축약 방법을 제안한다. 음악의 길이에 따라 길이가 비례하는 크로마 특징 수열을 멀티스케일 2D-FTM(Two Dimensional Fourier Transform Magnitude)과 크로마 n-gram을 이용해 고정 길이의 특징벡터 형태로 표현함으로써 인덱싱을 용이하게 하고 거리비교를 단순화하여 식별 속도를 개선하였다. 축약된 크로마 벡터는 오디오 프레임 단위의 크로마 특징 수열의 전체적인 특징과 국지적인 특징을 유지하여 커버곡 간의 템포 변화와 조옮김, 리메이크 버전에 강인하도록 하였다. 제안된 방법의 성능 검증을 위해서 공개 데이터셋 및 유투브 웹사이트에서 자체 수집한 대규모 데이터에서 실험을 수행하여 커버곡 식별 성능을 유지하면서 검색 속도가 개선됨을 확인하였다. 본 논문은 대규모의 커버곡 식별 서비스에 적용할 수 있도록 기존의 방법에 비해 커버곡 식별 속도를 개선할 수 있는 크로마 특징 수열 축약 방법을 제안한다. 음악의 길이에 따라 길이가 비례하는 크로마 특징 수열을 멀티스케일 2D-FTM(Two Dimensional Fourier Transform Magnitude)과 크로마n-gram을 이용해 고정 길이의 특징벡터 형태로 표현함으로써 인덱싱을 용이하게 하고 거리비교를 단순화하여 식별 속도를 개선하였다. 축약된 크로마 벡터는 오디오 프레임 단위의 크로마 특징 수열의 전체적인 특징과 국지적인 특징을 유지하여 커버곡 간의 템포 변화와 조옮김, 리메이크 버전에 강인하도록 하였다. 제안된 방법의 성능 검증을 위해서 공개 데이터셋 및 유투브 웹사이트에서 자체 수집한 대규모 데이터에서 실험을 수행하여 커버곡 식별 성능을 유지하면서 검색 속도가 개선됨을 확인하였다. We proposed a chroma feature sequence abstraction method that can, when compared with conventional methods, improve the speed of cover song identification methods so that it can be used in large-scale music identification services. The proposed method represents the chroma feature sequence, which is proportional to the length of music, in fixed length feature vectors using multiscale 2D-FTM (two-dimensional Fourier-transform magnitude) and chroma n-gram. It facilitates indexing and simplifies distance comparison to improve identification speed. The abstracted chroma vector maintains the global and local characteristics of the chroma feature sequence, making it more robust to the tempo change, transposition, and remake versions of a song. We experimented using public datasets and large-scale datasets collected from the YouTube website in order to verify the performance of the proposed method, and we confirmed that search speed was improved while maintaining the cover song identification performance. KCI Citation Count: 0 |
Author | 서진수(Jinsoo Seo) 김정현(Junghyun Kim) 박지현(Jihyun Park) 유원영(Wonyoung Yoo) |
Author_xml | – sequence: 1 fullname: 김정현(Junghyun Kim) – sequence: 2 fullname: 박지현(Jihyun Park) – sequence: 3 fullname: 유원영(Wonyoung Yoo) – sequence: 4 fullname: 서진수(Jinsoo Seo) |
BackLink | https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002353746$$DAccess content in National Research Foundation of Korea (NRF) |
BookMark | eNpF0M1KAlEYBuBDFGTWDbSaTYsWM53fmTNL0SzTMmL2p_mVQR1jphbtjFyUrd2ELgRBhBZhEUR2Q3q8hyyjVu-7eHg_-DbAatSIfAC2EdSYjvW9opU91TBEXMNU0zWC-ApIYcKJqhOsr_51xNfBVpKEDsSIY8pNlALn8mMwG7emL31lOm7K23vZaymy25p3usps1Jw_PMv2QE6asjdRcE7NW8fTl4kSqZXYrv_Q3qt8HH3r-c3TrN-dDe-UeftdDjuKfOvIzucmWAvsWuJv_WYaWPl9K3uolsoHhWympFZNilTqMM4dTN1A97jPPYgMwiByXRNxGkDPC3zqUsw8g0KXOQjpEDs2447DDMKxS9JgdzkbxYGouqFo2OFPVhqiGovMmVUQ1MCmSY2F3VnaaphchiLykpo4yhTL3y_ExGSYYn1x_99FV3FY973QFheLYsfX4qSc24cGZZQYiHwBSwuJrg |
ContentType | Journal Article |
DBID | DBRKI TDB JDI ACYCR |
DEWEY | 005 |
DOI | 10.5626/KTCP.2018.24.6.318 |
DatabaseName | DBPIA - 디비피아 Nurimedia DBPIA Journals KoreaScience Korean Citation Index |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
Discipline | Computer Science |
DocumentTitleAlternate | Chroma Feature Abstraction using Multiscale 2D-FTM and N-gram for Cover Song Search |
DocumentTitle_FL | Chroma Feature Abstraction using Multiscale 2D-FTM and N-gram for Cover Song Search |
EISSN | 2383-6326 |
EndPage | 323 |
ExternalDocumentID | oai_kci_go_kr_ARTI_4729947 JAKO201823952426173 NODE07454371 |
GroupedDBID | .UV ALMA_UNASSIGNED_HOLDINGS DBRKI TDB JDI ACYCR M~E |
ID | FETCH-LOGICAL-k941-4b588b24cf6d8e8d0173501cc9184f0ddfe4c425d740c5b11602ba58bb57382c3 |
ISSN | 2383-6318 |
IngestDate | Tue Nov 21 21:27:34 EST 2023 Fri Dec 22 11:58:53 EST 2023 Thu Feb 06 13:28:49 EST 2025 |
IsDoiOpenAccess | true |
IsOpenAccess | true |
IsPeerReviewed | false |
IsScholarly | false |
Issue | 6 |
Keywords | 커버곡 식별 크로마 특징 cover song identification feature abstraction 음악 검색 음악 유사도 Chroma feature 특징 축약 music search music similarity |
Language | Korean |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-k941-4b588b24cf6d8e8d0173501cc9184f0ddfe4c425d740c5b11602ba58bb57382c3 |
OpenAccessLink | http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201823952426173&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01 |
PageCount | 6 |
ParticipantIDs | nrf_kci_oai_kci_go_kr_ARTI_4729947 kisti_ndsl_JAKO201823952426173 nurimedia_primary_NODE07454371 |
PublicationCentury | 2000 |
PublicationDate | 2018 |
PublicationDateYYYYMMDD | 2018-01-01 |
PublicationDate_xml | – year: 2018 text: 2018 |
PublicationDecade | 2010 |
PublicationTitle | 정보과학회 컴퓨팅의 실제 논문지 |
PublicationTitleAlternate | KIISE transactions on computing practices |
PublicationYear | 2018 |
Publisher | Korean Institute of Information Scientists and Engineers 한국정보과학회 |
Publisher_xml | – name: Korean Institute of Information Scientists and Engineers – name: 한국정보과학회 |
SSID | ssib021824891 ssib044742771 ssib053377435 ssib019653237 |
Score | 1.6436224 |
Snippet | We proposed a chroma feature sequence abstraction method that can, when compared with conventional methods, improve the speed of cover song identification... 본 논문은 대규모의 커버곡 식별 서비스에 적용할 수 있도록 기존의 방법에 비해 커버곡 식별 속도를 개선할 수 있는 크로마 특징 수열 축약 방법을 제안한다. 음악의 길이에 따라 길이가 비례하는 크로마 특징 수열을 멀티스케일 2D-FTM(Two Dimensional Fourier... |
SourceID | nrf kisti nurimedia |
SourceType | Open Website Open Access Repository Publisher |
StartPage | 318 |
SubjectTerms | 컴퓨터학 |
Title | 커버곡 검색을 위한 멀티스케일 2D-FTM과 n-gram을 이용한 크로마 특징 축약 |
URI | https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE07454371 http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201823952426173&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01 https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002353746 |
Volume | 24 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
ispartofPNX | 정보과학회 컴퓨팅의 실제 논문지, 2018, 24(6), , pp.318-323 |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR1NT9RAtEE86MVvI36QxjinTddtZ9rOHNvuEoQAHtaEW91-GbJmMQgXDwYjB8XzXgwcSEgIiQcDxMSIf4jt_gffm-mWBkn8uHRfp--r7-30vdfOh6Y9Su3ITRoiM1wncg1GXdPgdscxIPRmKTU7EGRwgvPcvDP9jM0s2otjF44qo5bWVqN6_ObceSX_41VoA7_iLNl_8GzJFBoABv_CETwMx7_yMWkFxPeJx0jLJ75FOAAe8SnxzJqE5EAGQOKUcIGAaAJSTUKBRG8SYQNcQw6ekOiAAtwUnSeZg5Sg4AQM_KBmNY2p9lwhDM57Bg7yOiMAMCWt8JBzRRKgmMQLpEgTFUHAJZyra8BU6gpNwpasfAdpkZVN_GY1n5Z4DXnVl7qwUqmRRCXaIzyo1wqD-erGwU5cSoSbswuVBZdI3C9uHJkr6wCKr1QFHrxQkJdfe6RcUVipUAnZEc5OUaRd1a1I4nNQpGc8ZWufCAUAillFAc-h2RQXqSfnRO2zPXqFU403kDBRw6FFU1ptUwsJjIKUmmhedMZqxClp1ZmavH02LkKSi69oZtvBUxzNyOsWqzv1krS6CPmZ5KAcsjnjzS4gqUWFjWmd6dIL2kXLdU0cSDv3tjV6iuMSlbSyAhJuEcD46YpMjLkMyUbnUG9ACSJ3wi2toWa3odaPf9cZykisrZYgG-ytQBJ5qbeGO2HA47SSGbavaVeKkk73VP-8ro11l29oV0fbpehF9LypPc9_7A4ONk4Od_STg_X8_cd8e0PPtzaG_S19sL8-_PQ139zNj9fz7WNddbCTw2NddS2Jun2Uf95H7OG7L4OdrcHeB324-T3f6-v5t37e_3lLa0-12sG0UWxwYnQFMw0W2ZxHFoszJ-EpTyA44mf-OBYmZ1kjSbKUxRBTE5c1YjsyTadhRR2bR5HtUm7F9LY23lvupXc0HQJ1lIm0kbjUYZlIeMd2UsvKKHeyRhrRCW1S2izsJa9fhuf4ckJ7CMYMu_FSiAvO4--L5bC7EkJZ_SRkUIIL5gKX0tbhK7UaTji_0GxBHWLjc_7un8Tc0y5ji3qHeV8bX11ZSx9AVr8aTco_0S8FG8QX |
linkProvider | ISSN International Centre |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%EC%BB%A4%EB%B2%84%EA%B3%A1+%EA%B2%80%EC%83%89%EC%9D%84+%EC%9C%84%ED%95%9C+%EB%A9%80%ED%8B%B0%EC%8A%A4%EC%BC%80%EC%9D%BC+2D-FTM%EA%B3%BC+n-gram%EC%9D%84+%EC%9D%B4%EC%9A%A9%ED%95%9C+%ED%81%AC%EB%A1%9C%EB%A7%88+%ED%8A%B9%EC%A7%95+%EC%B6%95%EC%95%BD&rft.jtitle=%EC%A0%95%EB%B3%B4%EA%B3%BC%ED%95%99%ED%9A%8C.+%EC%BB%B4%ED%93%A8%ED%8C%85%EC%9D%98+%EC%8B%A4%EC%A0%9C+%EB%85%BC%EB%AC%B8%EC%A7%80&rft.au=%EA%B9%80%EC%A0%95%ED%98%84&rft.au=%EB%B0%95%EC%A7%80%ED%98%84&rft.au=%EC%9C%A0%EC%9B%90%EC%98%81&rft.au=%EC%84%9C%EC%A7%84%EC%88%98&rft.date=2018&rft.issn=2383-6318&rft.eissn=2383-6326&rft.volume=24&rft.issue=6&rft.spage=318&rft.epage=323&rft_id=info:doi/10.5626%2FKTCP.2018.24.6.318&rft.externalDBID=n%2Fa&rft.externalDocID=JAKO201823952426173 |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2383-6318&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2383-6318&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2383-6318&client=summon |