Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스

In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop based cloud environment for analysis of public medical information big data. In fact, it includes the ability to quickly and flexibly extend storage, memory, and other resources in a situatio...

Full description

Saved in:
Bibliographic Details
Published in한국정보통신학회논문지 Vol. 22; no. 10; pp. 1277 - 1286
Main Authors 박민희(Min-hee Park), 조영복(Young-bok Cho), 김소영(So Young Kim), 박종배(Jong-bae Park), 박종혁(Jong-hyock Park)
Format Journal Article
LanguageKorean
Published 한국정보통신학회 2018
Subjects
Online AccessGet full text
ISSN2234-4772
2288-4165
DOI10.6109/jkiice.2018.22.10.1277

Cover

Abstract In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop based cloud environment for analysis of public medical information big data. In fact, it includes the ability to quickly and flexibly extend storage, memory, and other resources in a situation where log data accumulates or grows over time. In addition, when real-time analysis of accumulated unstructured log data is required, the system adopts Hadoop-based analysis module to overcome the processing limit of existing analysis tools. Therefore, it provides a function to perform parallel distributed processing of a large amount of log data quickly and reliably. Perform frequency analysis and chi-square test for big data analysis. In addition, multivariate logistic regression analysis of significance level 0.05 and multivariate logistic regression analysis of meaningful variables (p<0.05) were performed. Multivariate logistic regression analysis was performed for each model 3. 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p<0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다.
AbstractList In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop based cloud environment for analysis of public medical information big data. In fact, it includes the ability to quickly and flexibly extend storage, memory, and other resources in a situation where log data accumulates or grows over time. In addition, when real-time analysis of accumulated unstructured log data is required, the system adopts Hadoop-based analysis module to overcome the processing limit of existing analysis tools. Therefore, it provides a function to perform parallel distributed processing of a large amount of log data quickly and reliably. Perform frequency analysis and chi-square test for big data analysis. In addition, multivariate logistic regression analysis of significance level 0.05 and multivariate logistic regression analysis of meaningful variables (p<0.05) were performed. Multivariate logistic regression analysis was performed for each model 3. 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p<0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다.
본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop)기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p <0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다. In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop basedcloud environment for analysis of public medical information big data. In fact, it includes the ability to quickly andflexibly extend storage, memory, and other resources in a situation where log data accumulates or grows over time. Inaddition, when real-time analysis of accumulated unstructured log data is required, the system adopts Hadoop-basedanalysis module to overcome the processing limit of existing analysis tools. Therefore, it provides a function to performparallel distributed processing of a large amount of log data quickly and reliably. Perform frequency analysis andchi-square test for big data analysis. In addition, multivariate logistic regression analysis of significance level 0.05 andmultivariate logistic regression analysis of meaningful variables (p <0.05) were performed. Multivariate logistic regressionanalysis was performed for each model 3. KCI Citation Count: 2
Author 조영복(Young-bok Cho)
박민희(Min-hee Park)
박종혁(Jong-hyock Park)
김소영(So Young Kim)
박종배(Jong-bae Park)
Author_xml – sequence: 1
  fullname: 박민희(Min-hee Park)
– sequence: 2
  fullname: 조영복(Young-bok Cho)
– sequence: 3
  fullname: 김소영(So Young Kim)
– sequence: 4
  fullname: 박종배(Jong-bae Park)
– sequence: 5
  fullname: 박종혁(Jong-hyock Park)
BackLink https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002398517$$DAccess content in National Research Foundation of Korea (NRF)
BookMark eNpFkMtKHEEUhgsxoFFfIdQmiyx6UnXq1r0cjHdxIMy-6JnqkbK1W6aTRXYuWhch2TkoMg2BBNwYaC8T9JW6a97BNhPI4vB_HD4Oh_81mk_SJELoDSUtSUnw_iC2th-1gFC_BdBq1hSUmkOLAL7vcSrF_Asz7nGlYAGtZJntESZBBZTJRZRuhiZNj6vHsi4vXXGJq_tJVY4bqn9-cz9G9f0Drp9Ocf29dMXDNC9x_Sd3eeGKHE_PJtPRGDdTTX67ixuX37rROa7uTtx1jt3VuSseZzZ2-bh-yt3XX8vo1SA8zKKVf7mEuutr3dVNb7ezsbXa3vXigEtPCBADYnqGgyESpAklFUADJpunuVGyz1WkQuj1he_7QikTMIi47AWM0wEQtoTezc4mw4GO-1anof2b-6mOh7r9sbulmVKCsaBx387c2GafrE5Mdqi32zudl06ZYAoYIcpn_73k89AeRcaG-riBcPhF73U-rBElBAUh2TPMzJf1
ContentType Journal Article
DBID DBRKI
TDB
JDI
ACYCR
DEWEY 003.5
DOI 10.6109/jkiice.2018.22.10.1277
DatabaseName DBPIA - 디비피아
Nurimedia DBPIA Journals
KoreaScience
Korean Citation Index
DatabaseTitleList

DeliveryMethod fulltext_linktorsrc
Discipline Applied Sciences
Mathematics
DocumentTitleAlternate Analysis of Factors for Korean Women's Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis
DocumentTitle_FL Analysis of Factors for Korean Women’s Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis
EISSN 2288-4165
EndPage 1286
ExternalDocumentID oai_kci_go_kr_ARTI_3775339
JAKO201835372300783
NODE07551256
GroupedDBID .UV
ALMA_UNASSIGNED_HOLDINGS
DBRKI
TDB
JDI
ACYCR
ID FETCH-LOGICAL-k946-5525f0dbd42d0626da615219361364d76c47e7a2bc5888577d932e46b9341f203
ISSN 2234-4772
IngestDate Sun Mar 09 07:53:23 EDT 2025
Fri Dec 22 12:03:31 EST 2023
Thu Feb 06 13:31:41 EST 2025
IsDoiOpenAccess true
IsOpenAccess true
IsPeerReviewed true
IsScholarly true
Issue 10
Keywords 여성암
자궁경부암
지역건강조사 빅 데이터
Female cancer
건강검진
Local Health Survey Big Data
유방암
Health medical examination
Breast cancer
Cervical cancer
Language Korean
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-k946-5525f0dbd42d0626da615219361364d76c47e7a2bc5888577d932e46b9341f203
Notes KISTI1.1003/JNL.JAKO201835372300783
http://jkiice.org
OpenAccessLink http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201835372300783&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01
PageCount 10
ParticipantIDs nrf_kci_oai_kci_go_kr_ARTI_3775339
kisti_ndsl_JAKO201835372300783
nurimedia_primary_NODE07551256
PublicationCentury 2000
PublicationDate 2018
PublicationDateYYYYMMDD 2018-01-01
PublicationDate_xml – year: 2018
  text: 2018
PublicationDecade 2010
PublicationTitle 한국정보통신학회논문지
PublicationTitleAlternate Journal of the Korea Institute of Information and Communication Engineering
PublicationYear 2018
Publisher 한국정보통신학회
Publisher_xml – name: 한국정보통신학회
SSID ssib036279136
ssib053377456
ssib044738262
ssib015937029
ssib023393675
ssib012146319
Score 2.011139
Snippet In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop based cloud environment for analysis of public...
본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수...
SourceID nrf
kisti
nurimedia
SourceType Open Website
Open Access Repository
Publisher
StartPage 1277
SubjectTerms 전자/정보통신공학
Title Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스
URI https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE07551256
http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201835372300783&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01
https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002398517
Volume 22
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 한국정보통신학회논문지, 2018, 22(10), , pp.1277-1286
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrR3LbtNA0CrlABcEAkR5VBbCp8jBsXe9u0c7SVWK2qISpN6sOLZpCIqr0l44IA6GA4JbKyrUSEggcQEp0Ba1v5S4_8Dsrp06UImHkBJ7svPw7EyyO2NvZhXlFrJaRmQTXw8qISQodrOp-7gZ6BDtMuRTHNjiPuT8gj37AM0t4-WJyaXCqqWNdb_cenri_0r-xavQBn7l_5L9C8-OhEIDwOBfOIKH4fhHPoZhI45XtbqjuVRzDa3u8iOjWr2qsRoAJYGzNBcLAHDVEY5TO5ZGRYsDKCz4gRiVBMQ0igVEa0K44HORVq9pFEGLpLL5B8DBEdCSiHIJcLLFhWtcNKuWRpDQBWuOJCeaU80EuBXRAjRIai4WYnD1iJQJSAeQuS70Vw1KOVTN-yBxjuagYiB-sjLjZij0ASS4HJtxMQE4wnhgH6y5AoCOuDTXd_QcKHeLEOzMCNoa1x_ITTrf7uorYVi6Jxats2MmkFLJ7U4h4M_VwsAkxmjdjzul6ko8xuWIPgsuUF06V7Kb9H5cEowlsYU2O0E_uKbJuyNb4GXSuZhfqTmuYHabKJvT-E_6f9nzeGKCiBLpiMgtl8ph1ga_TQjucXFmNc3iCGIU5smKmW3eE2YfZT30n-dzW5bDfdRp8wJbvFtl0yyLmig5_1it9IXFWh1iYAhisX1KOQ1EFb7Md_5ZPZ9jKnwje-u4hCFE8xYpPJk2LYtZhfpGEN8RVrFGITtCxKKFEpuQLUECJTaJHplFFiLgut8-WXNIhHl22IZ4trsGYfCZ7gbfywMmhEJs2zivnMuSUtWRI8wFZaITX1RiOboMDvrD_nba21YHu_uD_g5Aww-v0_dbw909dXj4Qh2-6ae9vaOkrw6_J2nSS3uJevRy_2hrR4X3YP9L-vZzmnxNtzbVwbfn6adETd9tpr0DSa2myc7wMElffbykNGbqjeqsnm3PoncYsnWMTRwZgR8gMzBs0w6aNs8FwHpgLhQQu4VISJqm38KUUkxIAKliiGyfQeAcmYZ1WZnsxt3wiqJGJIp8RjFmOEBhaPhGxO9LoYgSQg0WTCnTwl5eN3jy2Jtz7i5yg1rYIjCl8HUIU8pNMKTXabU9Xi6fnx_GXmfNc5YadzzwELiJgZSRnb1VWcvHK35jrv6O4Jpyll9Y3oG9rkyur22ENyAnWfenxZfsBzpG-1o
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=Hadoop%EA%B8%B0%EB%B0%98%EC%9D%98+%EA%B3%B5%EA%B0%9C%EC%9D%98%EB%A3%8C%EC%A0%95%EB%B3%B4+%EB%B9%85+%EB%8D%B0%EC%9D%B4%ED%84%B0+%EB%B6%84%EC%84%9D%EC%9D%84+%ED%86%B5%ED%95%9C+%ED%95%9C%EA%B5%AD%EC%97%AC%EC%84%B1%EC%95%94+%EA%B2%80%EC%A7%84+%EC%9A%94%EC%9D%B8%EB%B6%84%EC%84%9D+%EC%84%9C%EB%B9%84%EC%8A%A4&rft.jtitle=%ED%95%9C%EA%B5%AD%EC%A0%95%EB%B3%B4%ED%86%B5%EC%8B%A0%ED%95%99%ED%9A%8C%EB%85%BC%EB%AC%B8%EC%A7%80&rft.au=%EB%B0%95%EB%AF%BC%ED%9D%AC%28Min-hee+Park%29&rft.au=%EC%A1%B0%EC%98%81%EB%B3%B5%28Young-bok+Cho%29&rft.au=%EA%B9%80%EC%86%8C%EC%98%81%28So+Young+Kim%29&rft.au=%EB%B0%95%EC%A2%85%EB%B0%B0%28Jong-bae+Park%29&rft.date=2018&rft.pub=%ED%95%9C%EA%B5%AD%EC%A0%95%EB%B3%B4%ED%86%B5%EC%8B%A0%ED%95%99%ED%9A%8C&rft.issn=2234-4772&rft.eissn=2288-4165&rft.volume=22&rft.issue=10&rft.spage=1277&rft.epage=1286&rft_id=info:doi/10.6109%2Fjkiice.2018.22.10.1277&rft.externalDocID=NODE07551256
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2234-4772&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2234-4772&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2234-4772&client=summon