Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스
In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop based cloud environment for analysis of public medical information big data. In fact, it includes the ability to quickly and flexibly extend storage, memory, and other resources in a situatio...
Saved in:
Published in | 한국정보통신학회논문지 Vol. 22; no. 10; pp. 1277 - 1286 |
---|---|
Main Authors | , , , , |
Format | Journal Article |
Language | Korean |
Published |
한국정보통신학회
2018
|
Subjects | |
Online Access | Get full text |
ISSN | 2234-4772 2288-4165 |
DOI | 10.6109/jkiice.2018.22.10.1277 |
Cover
Abstract | In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop based cloud environment for analysis of public medical information big data. In fact, it includes the ability to quickly and flexibly extend storage, memory, and other resources in a situation where log data accumulates or grows over time. In addition, when real-time analysis of accumulated unstructured log data is required, the system adopts Hadoop-based analysis module to overcome the processing limit of existing analysis tools. Therefore, it provides a function to perform parallel distributed processing of a large amount of log data quickly and reliably. Perform frequency analysis and chi-square test for big data analysis. In addition, multivariate logistic regression analysis of significance level 0.05 and multivariate logistic regression analysis of meaningful variables (p<0.05) were performed. Multivariate logistic regression analysis was performed for each model 3. 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p<0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다. |
---|---|
AbstractList | In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop based cloud environment for analysis of public medical information big data. In fact, it includes the ability to quickly and flexibly extend storage, memory, and other resources in a situation where log data accumulates or grows over time. In addition, when real-time analysis of accumulated unstructured log data is required, the system adopts Hadoop-based analysis module to overcome the processing limit of existing analysis tools. Therefore, it provides a function to perform parallel distributed processing of a large amount of log data quickly and reliably. Perform frequency analysis and chi-square test for big data analysis. In addition, multivariate logistic regression analysis of significance level 0.05 and multivariate logistic regression analysis of meaningful variables (p<0.05) were performed. Multivariate logistic regression analysis was performed for each model 3. 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p<0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다. 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop)기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p <0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다. In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop basedcloud environment for analysis of public medical information big data. In fact, it includes the ability to quickly andflexibly extend storage, memory, and other resources in a situation where log data accumulates or grows over time. Inaddition, when real-time analysis of accumulated unstructured log data is required, the system adopts Hadoop-basedanalysis module to overcome the processing limit of existing analysis tools. Therefore, it provides a function to performparallel distributed processing of a large amount of log data quickly and reliably. Perform frequency analysis andchi-square test for big data analysis. In addition, multivariate logistic regression analysis of significance level 0.05 andmultivariate logistic regression analysis of meaningful variables (p <0.05) were performed. Multivariate logistic regressionanalysis was performed for each model 3. KCI Citation Count: 2 |
Author | 조영복(Young-bok Cho) 박민희(Min-hee Park) 박종혁(Jong-hyock Park) 김소영(So Young Kim) 박종배(Jong-bae Park) |
Author_xml | – sequence: 1 fullname: 박민희(Min-hee Park) – sequence: 2 fullname: 조영복(Young-bok Cho) – sequence: 3 fullname: 김소영(So Young Kim) – sequence: 4 fullname: 박종배(Jong-bae Park) – sequence: 5 fullname: 박종혁(Jong-hyock Park) |
BackLink | https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002398517$$DAccess content in National Research Foundation of Korea (NRF) |
BookMark | eNpFkMtKHEEUhgsxoFFfIdQmiyx6UnXq1r0cjHdxIMy-6JnqkbK1W6aTRXYuWhch2TkoMg2BBNwYaC8T9JW6a97BNhPI4vB_HD4Oh_81mk_SJELoDSUtSUnw_iC2th-1gFC_BdBq1hSUmkOLAL7vcSrF_Asz7nGlYAGtZJntESZBBZTJRZRuhiZNj6vHsi4vXXGJq_tJVY4bqn9-cz9G9f0Drp9Ocf29dMXDNC9x_Sd3eeGKHE_PJtPRGDdTTX67ixuX37rROa7uTtx1jt3VuSseZzZ2-bh-yt3XX8vo1SA8zKKVf7mEuutr3dVNb7ezsbXa3vXigEtPCBADYnqGgyESpAklFUADJpunuVGyz1WkQuj1he_7QikTMIi47AWM0wEQtoTezc4mw4GO-1anof2b-6mOh7r9sbulmVKCsaBx387c2GafrE5Mdqi32zudl06ZYAoYIcpn_73k89AeRcaG-riBcPhF73U-rBElBAUh2TPMzJf1 |
ContentType | Journal Article |
DBID | DBRKI TDB JDI ACYCR |
DEWEY | 003.5 |
DOI | 10.6109/jkiice.2018.22.10.1277 |
DatabaseName | DBPIA - 디비피아 Nurimedia DBPIA Journals KoreaScience Korean Citation Index |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
Discipline | Applied Sciences Mathematics |
DocumentTitleAlternate | Analysis of Factors for Korean Women's Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis |
DocumentTitle_FL | Analysis of Factors for Korean Women’s Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis |
EISSN | 2288-4165 |
EndPage | 1286 |
ExternalDocumentID | oai_kci_go_kr_ARTI_3775339 JAKO201835372300783 NODE07551256 |
GroupedDBID | .UV ALMA_UNASSIGNED_HOLDINGS DBRKI TDB JDI ACYCR |
ID | FETCH-LOGICAL-k946-5525f0dbd42d0626da615219361364d76c47e7a2bc5888577d932e46b9341f203 |
ISSN | 2234-4772 |
IngestDate | Sun Mar 09 07:53:23 EDT 2025 Fri Dec 22 12:03:31 EST 2023 Thu Feb 06 13:31:41 EST 2025 |
IsDoiOpenAccess | true |
IsOpenAccess | true |
IsPeerReviewed | true |
IsScholarly | true |
Issue | 10 |
Keywords | 여성암 자궁경부암 지역건강조사 빅 데이터 Female cancer 건강검진 Local Health Survey Big Data 유방암 Health medical examination Breast cancer Cervical cancer |
Language | Korean |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-k946-5525f0dbd42d0626da615219361364d76c47e7a2bc5888577d932e46b9341f203 |
Notes | KISTI1.1003/JNL.JAKO201835372300783 http://jkiice.org |
OpenAccessLink | http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201835372300783&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01 |
PageCount | 10 |
ParticipantIDs | nrf_kci_oai_kci_go_kr_ARTI_3775339 kisti_ndsl_JAKO201835372300783 nurimedia_primary_NODE07551256 |
PublicationCentury | 2000 |
PublicationDate | 2018 |
PublicationDateYYYYMMDD | 2018-01-01 |
PublicationDate_xml | – year: 2018 text: 2018 |
PublicationDecade | 2010 |
PublicationTitle | 한국정보통신학회논문지 |
PublicationTitleAlternate | Journal of the Korea Institute of Information and Communication Engineering |
PublicationYear | 2018 |
Publisher | 한국정보통신학회 |
Publisher_xml | – name: 한국정보통신학회 |
SSID | ssib036279136 ssib053377456 ssib044738262 ssib015937029 ssib023393675 ssib012146319 |
Score | 2.011139 |
Snippet | In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop based cloud environment for analysis of public... 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수... |
SourceID | nrf kisti nurimedia |
SourceType | Open Website Open Access Repository Publisher |
StartPage | 1277 |
SubjectTerms | 전자/정보통신공학 |
Title | Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스 |
URI | https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE07551256 http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201835372300783&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01 https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002398517 |
Volume | 22 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
ispartofPNX | 한국정보통신학회논문지, 2018, 22(10), , pp.1277-1286 |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrR3LbtNA0CrlABcEAkR5VBbCp8jBsXe9u0c7SVWK2qISpN6sOLZpCIqr0l44IA6GA4JbKyrUSEggcQEp0Ba1v5S4_8Dsrp06UImHkBJ7svPw7EyyO2NvZhXlFrJaRmQTXw8qISQodrOp-7gZ6BDtMuRTHNjiPuT8gj37AM0t4-WJyaXCqqWNdb_cenri_0r-xavQBn7l_5L9C8-OhEIDwOBfOIKH4fhHPoZhI45XtbqjuVRzDa3u8iOjWr2qsRoAJYGzNBcLAHDVEY5TO5ZGRYsDKCz4gRiVBMQ0igVEa0K44HORVq9pFEGLpLL5B8DBEdCSiHIJcLLFhWtcNKuWRpDQBWuOJCeaU80EuBXRAjRIai4WYnD1iJQJSAeQuS70Vw1KOVTN-yBxjuagYiB-sjLjZij0ASS4HJtxMQE4wnhgH6y5AoCOuDTXd_QcKHeLEOzMCNoa1x_ITTrf7uorYVi6Jxats2MmkFLJ7U4h4M_VwsAkxmjdjzul6ko8xuWIPgsuUF06V7Kb9H5cEowlsYU2O0E_uKbJuyNb4GXSuZhfqTmuYHabKJvT-E_6f9nzeGKCiBLpiMgtl8ph1ga_TQjucXFmNc3iCGIU5smKmW3eE2YfZT30n-dzW5bDfdRp8wJbvFtl0yyLmig5_1it9IXFWh1iYAhisX1KOQ1EFb7Md_5ZPZ9jKnwje-u4hCFE8xYpPJk2LYtZhfpGEN8RVrFGITtCxKKFEpuQLUECJTaJHplFFiLgut8-WXNIhHl22IZ4trsGYfCZ7gbfywMmhEJs2zivnMuSUtWRI8wFZaITX1RiOboMDvrD_nba21YHu_uD_g5Aww-v0_dbw909dXj4Qh2-6ae9vaOkrw6_J2nSS3uJevRy_2hrR4X3YP9L-vZzmnxNtzbVwbfn6adETd9tpr0DSa2myc7wMElffbykNGbqjeqsnm3PoncYsnWMTRwZgR8gMzBs0w6aNs8FwHpgLhQQu4VISJqm38KUUkxIAKliiGyfQeAcmYZ1WZnsxt3wiqJGJIp8RjFmOEBhaPhGxO9LoYgSQg0WTCnTwl5eN3jy2Jtz7i5yg1rYIjCl8HUIU8pNMKTXabU9Xi6fnx_GXmfNc5YadzzwELiJgZSRnb1VWcvHK35jrv6O4Jpyll9Y3oG9rkyur22ENyAnWfenxZfsBzpG-1o |
linkProvider | ISSN International Centre |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=Hadoop%EA%B8%B0%EB%B0%98%EC%9D%98+%EA%B3%B5%EA%B0%9C%EC%9D%98%EB%A3%8C%EC%A0%95%EB%B3%B4+%EB%B9%85+%EB%8D%B0%EC%9D%B4%ED%84%B0+%EB%B6%84%EC%84%9D%EC%9D%84+%ED%86%B5%ED%95%9C+%ED%95%9C%EA%B5%AD%EC%97%AC%EC%84%B1%EC%95%94+%EA%B2%80%EC%A7%84+%EC%9A%94%EC%9D%B8%EB%B6%84%EC%84%9D+%EC%84%9C%EB%B9%84%EC%8A%A4&rft.jtitle=%ED%95%9C%EA%B5%AD%EC%A0%95%EB%B3%B4%ED%86%B5%EC%8B%A0%ED%95%99%ED%9A%8C%EB%85%BC%EB%AC%B8%EC%A7%80&rft.au=%EB%B0%95%EB%AF%BC%ED%9D%AC%28Min-hee+Park%29&rft.au=%EC%A1%B0%EC%98%81%EB%B3%B5%28Young-bok+Cho%29&rft.au=%EA%B9%80%EC%86%8C%EC%98%81%28So+Young+Kim%29&rft.au=%EB%B0%95%EC%A2%85%EB%B0%B0%28Jong-bae+Park%29&rft.date=2018&rft.pub=%ED%95%9C%EA%B5%AD%EC%A0%95%EB%B3%B4%ED%86%B5%EC%8B%A0%ED%95%99%ED%9A%8C&rft.issn=2234-4772&rft.eissn=2288-4165&rft.volume=22&rft.issue=10&rft.spage=1277&rft.epage=1286&rft_id=info:doi/10.6109%2Fjkiice.2018.22.10.1277&rft.externalDocID=NODE07551256 |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2234-4772&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2234-4772&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2234-4772&client=summon |