AVX-512를 활용한 인텔 프로세서에서 행렬 곱셈 연산의 오토튜닝 방법

BLAS는 선형 대수 및 행렬 연산을 수행할 때 널리 사용되는 라이브러리이다. 특히 블럭 연산을 지원하는 level-3 BLAS는 캐시에 올라오는 데이터의 재사용성을 높여 성능을 최대로 얻을 수 있도록 한다. 이를 위해서는 프로세서의 캐시에 맞는 행렬의 블록크기, 루프 언롤링(loop unrolling) 횟수, 프리패칭(prefetching) 거리 등이 최적화 되는 설정값을 찾아내야 한다. 이를 컴퓨터가 자동으로 실행하면서 최적화하는 과정을 오토튜닝이라고 한다. Intel Knights Landing 등 Intel AVX-512를...

Full description

Saved in:
Bibliographic Details
Published in정보과학회 컴퓨팅의 실제 논문지 Vol. 24; no. 12; pp. 693 - 698
Main Authors 이영하(Yeongha Lee), 김래현(Raehyun Kim), 최재영(Jaeyoung Choi)
Format Journal Article
LanguageKorean
Published Korean Institute of Information Scientists and Engineers 01.12.2018
한국정보과학회
Subjects
Online AccessGet full text
ISSN2383-6318
2383-6326
DOI10.5626/KTCP.2018.24.12.693

Cover

Abstract BLAS는 선형 대수 및 행렬 연산을 수행할 때 널리 사용되는 라이브러리이다. 특히 블럭 연산을 지원하는 level-3 BLAS는 캐시에 올라오는 데이터의 재사용성을 높여 성능을 최대로 얻을 수 있도록 한다. 이를 위해서는 프로세서의 캐시에 맞는 행렬의 블록크기, 루프 언롤링(loop unrolling) 횟수, 프리패칭(prefetching) 거리 등이 최적화 되는 설정값을 찾아내야 한다. 이를 컴퓨터가 자동으로 실행하면서 최적화하는 과정을 오토튜닝이라고 한다. Intel Knights Landing 등 Intel AVX-512를 사용하는 최신의 인텔 프로세서들은 BLAS 최적화를 위한 오토튜닝 방법이 거의 연구되어 있지 않으므로, 본 연구에서는 Intel AVX-512를 사용하는 인텔의 아키텍처들에서 level-3 BLAS의 성능을 최대화하기 위한 오토튜닝 방법을 보인다. BLAS is a widely used library for performing linear algebra and matrix operations. Level-3 BLAS, in particular, supports block operations to maximize performance by increasing the reusability of data in the cache. For a block operation, it is necessary to find optimal values that optimize the block size of the matrix matched to the processor's cache, the number of loop unrolling times, and the prefetching distance. Autotuning means that the computer runs and automatically optimizes its performance. The appropriate autotuning processes for BLAS routines have not studied on the recent Intel processors with AVX-512 such as Intel Knights Landing and Intel Scalable processors. In this study, we have demonstrated an autotuning method to maximize the performance of level-3 BLAS in Intel architectures with Intel AVX-512. KCI Citation Count: 0
AbstractList BLAS는 선형 대수 및 행렬 연산을 수행할 때 널리 사용되는 라이브러리이다. 특히 블럭 연산을 지원하는 level-3 BLAS는 캐시에 올라오는 데이터의 재사용성을 높여 성능을 최대로 얻을 수 있도록 한다. 이를 위해서는 프로세서의 캐시에 맞는 행렬의 블록크기, 루프 언롤링(loop unrolling) 횟수, 프리패칭(prefetching) 거리 등이 최적화 되는 설정값을 찾아내야 한다. 이를 컴퓨터가 자동으로 실행하면서 최적화하는 과정을 오토튜닝이라고 한다. Intel Knights Landing 등 Intel AVX-512를 사용하는 최신의 인텔 프로세서들은 BLAS 최적화를 위한 오토튜닝 방법이 거의 연구되어 있지 않으므로, 본 연구에서는 Intel AVX-512를 사용하는 인텔의 아키텍처들에서 level-3 BLAS의 성능을 최대화하기 위한 오토튜닝 방법을 보인다. BLAS is a widely used library for performing linear algebra and matrix operations. Level-3 BLAS, in particular, supports block operations to maximize performance by increasing the reusability of data in the cache. For a block operation, it is necessary to find optimal values that optimize the block size of the matrix matched to the processor's cache, the number of loop unrolling times, and the prefetching distance. Autotuning means that the computer runs and automatically optimizes its performance. The appropriate autotuning processes for BLAS routines have not studied on the recent Intel processors with AVX-512 such as Intel Knights Landing and Intel Scalable processors. In this study, we have demonstrated an autotuning method to maximize the performance of level-3 BLAS in Intel architectures with Intel AVX-512. KCI Citation Count: 0
Author 이영하(Yeongha Lee)
최재영(Jaeyoung Choi)
김래현(Raehyun Kim)
Author_xml – sequence: 1
  fullname: 이영하(Yeongha Lee)
– sequence: 2
  fullname: 김래현(Raehyun Kim)
– sequence: 3
  fullname: 최재영(Jaeyoung Choi)
BackLink https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002412969$$DAccess content in National Research Foundation of Korea (NRF)
BookMark eNo9jD1Lw0Achw-pYK39BC5ZHBwSk7vL3T9jqW_FYkWCiEu4pI2EaiopDq7Sii-LQ2urpFBBh4JD1aWDn8hcvoNFi8vveYaH3yLKhI2whtCyoWsmw2xtxy7uaVg3QMNUM7DGLDKHspgAURnBLPPvBiygfLMZuDo2AFOwjCw6KhwcqqaBk9cvJX2M5dMo7caKHEzSdkdJO63kOZatiWzFsnc_XSV9uEmGb8r357tsXyuyN5aXYznoK7L_kl4N09s4uRsoyXiUfHSX0LwvTpq1_Iw5ZG9u2MVttVzZKhULZTVk1FKF6XsUc6YT6ltAPR1cDrwKYHFLMIaBmkB18GsYg-v5rmtySkG4LiXCxz4hObT6dxtGvlP3Aqchgl8eN5x65BT27ZJDAAxq6dN2ZdaeR8FprRoI52wqIrpwdivrGzo3uWlyi_wA2_V8Sg
ContentType Journal Article
DBID DBRKI
TDB
ACYCR
DOI 10.5626/KTCP.2018.24.12.693
DatabaseName DBPIA - 디비피아
Nurimedia DBPIA Journals
Korean Citation Index
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
DocumentTitleAlternate An Autotuning Method for Matrix-Matrix Multiplication on Intel Processors with AVX-512 Instructions
DocumentTitle_FL An Autotuning Method for Matrix-Matrix Multiplication on Intel Processors with AVX-512 Instructions
EISSN 2383-6326
EndPage 698
ExternalDocumentID oai_kci_go_kr_ARTI_3881490
NODE07575579
GroupedDBID .UV
ALMA_UNASSIGNED_HOLDINGS
DBRKI
TDB
ACYCR
ID FETCH-LOGICAL-n649-a5fc4276034f984c08b787d88979a6628458408fe228bcfbb57448abb43af2f33
ISSN 2383-6318
IngestDate Sun Mar 09 07:53:04 EDT 2025
Thu Feb 06 13:26:07 EST 2025
IsPeerReviewed false
IsScholarly false
Issue 12
Keywords 행렬곱셈
오토튜닝
인텔 스케일러블 프로세서
Intel Scalable processors
matrix-matrix multiplication
autotuning
인텔 KNL
Intel KNL
AVX-512
Language Korean
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-n649-a5fc4276034f984c08b787d88979a6628458408fe228bcfbb57448abb43af2f33
PageCount 6
ParticipantIDs nrf_kci_oai_kci_go_kr_ARTI_3881490
nurimedia_primary_NODE07575579
PublicationCentury 2000
PublicationDate 2018-12
PublicationDateYYYYMMDD 2018-12-01
PublicationDate_xml – month: 12
  year: 2018
  text: 2018-12
PublicationDecade 2010
PublicationTitle 정보과학회 컴퓨팅의 실제 논문지
PublicationYear 2018
Publisher Korean Institute of Information Scientists and Engineers
한국정보과학회
Publisher_xml – name: Korean Institute of Information Scientists and Engineers
– name: 한국정보과학회
SSID ssib021824891
ssib044742771
ssib053377435
ssib019653237
Score 1.6721013
Snippet BLAS는 선형 대수 및 행렬 연산을 수행할 때 널리 사용되는 라이브러리이다. 특히 블럭 연산을 지원하는 level-3 BLAS는 캐시에 올라오는 데이터의 재사용성을 높여 성능을 최대로 얻을 수 있도록 한다. 이를 위해서는 프로세서의 캐시에 맞는 행렬의 블록크기, 루프 언롤링(loop...
SourceID nrf
nurimedia
SourceType Open Website
Publisher
StartPage 693
SubjectTerms 컴퓨터학
Title AVX-512를 활용한 인텔 프로세서에서 행렬 곱셈 연산의 오토튜닝 방법
URI https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE07575579
https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002412969
Volume 24
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 정보과학회 컴퓨팅의 실제 논문지, 2018, 24(12), , pp.693-698
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR1NT9RAtAE86MVo1IgfpDHOaVPcttPpzLEtNQgBjVkNetm0SwuEZNds2AMePBgwflw8gKBZEkz0QOIB9cLBX8R2_4PvzbRLISR-XLqzr_M-Zl4778105j1Nu52ikU64MBh-W6dmVeA4yIzUSeEBM2nsunjAeWaWTT6iU3PO3NDwYWnXUmclHm88P_Vcyf9oFWCgVzwl-w-aHRAFAJRBv3AFDcP1r3TsPZ4zwJSS0CeeQ_ygQsIJIgQRAQkDIjziCQlxAFKRoAnicwRxAFFVHZxJKimYOR78xUqykFNyiagOIAqNES4kWpV4CPKIbxPflLUcwnklR_QVopUXQAKR3-PEo1IWhkSw4El-PuE-1KtgCZA8yca3iEqTWXjSSALQoG14F1jTQoagaLNqvEe4arzvy0oAsomnekHKekwqYI1SKdqBlIE7kibcCPKO8VzCB595in6leaO4WfDn4L0_SVrNhcWoIjc8iSMcEFXgLhMgK0KsijgcO9jiD6NkcbXTrMhM16LMx3cKjYQozYChxaeiZBUH7kqw2FoqsPLVHJOf2Bkz3WrjB5hjG0Xyc2nKgMhTsjAAqADeRczK0rouuGC2wezcqCVlmApNUJg9dXS9eL2tkhFjKmdl7g8xlSX8pKkFvxlXfaZrwQPcIMnHLYrr6gPcYzHMZ-9PhOCbuo7jimHtjOW6ckvFzIuwGPsxsKVdipuEiQUoP4rjRKlLEa34D7MUmLjI_LmDFqugYijYnVPEAuex2Qaf82yzg4kzYPQtOZK1C9r5fAaoe-p1vqgNLbcuaU_zV7n39Zfe_9jNPu31N7t6tnPQX9_Q-xtrvc_dbO0gW-tmW-_hqvc_vOntftMPf37P1l_r2dZ-9nI_29nWs-0v_Ve7_bfd3rsdvbe_1_uxeVmr3Q1rwaSRpz0xmowKI3LSBjSVVW2aCk4bVR6DUZ3nXLgiYgzcSZgzVHmaWBaPG2kcOy6lPIpjakepldr2FW2k2WomVzUdU1Yzk7F5K6I0cVnsNEzLihocuiPmsTOq3YIuqS83luoYZR5_F1r15XYd5tL36jbnJhXVUW1s0GP1ZyoETr2s0Gt_qnBdO3f0qN_QRlbaneQmuPIr8Zh8Bn4DCHvHPQ
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=AVX-512%EB%A5%BC+%ED%99%9C%EC%9A%A9%ED%95%9C+%EC%9D%B8%ED%85%94+%ED%94%84%EB%A1%9C%EC%84%B8%EC%84%9C%EC%97%90%EC%84%9C+%ED%96%89%EB%A0%AC+%EA%B3%B1%EC%85%88+%EC%97%B0%EC%82%B0%EC%9D%98+%EC%98%A4%ED%86%A0%ED%8A%9C%EB%8B%9D+%EB%B0%A9%EB%B2%95&rft.jtitle=%EC%A0%95%EB%B3%B4%EA%B3%BC%ED%95%99%ED%9A%8C+%EC%BB%B4%ED%93%A8%ED%8C%85%EC%9D%98+%EC%8B%A4%EC%A0%9C+%EB%85%BC%EB%AC%B8%EC%A7%80&rft.au=%EC%9D%B4%EC%98%81%ED%95%98%28Yeongha+Lee%29&rft.au=%EA%B9%80%EB%9E%98%ED%98%84%28Raehyun+Kim%29&rft.au=%EC%B5%9C%EC%9E%AC%EC%98%81%28Jaeyoung+Choi%29&rft.date=2018-12-01&rft.pub=Korean+Institute+of+Information+Scientists+and+Engineers&rft.issn=2383-6318&rft.eissn=2383-6326&rft.volume=24&rft.issue=12&rft.spage=693&rft.epage=698&rft_id=info:doi/10.5626%2FKTCP.2018.24.12.693&rft.externalDocID=NODE07575579
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2383-6318&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2383-6318&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2383-6318&client=summon