빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템
페이지 정보
최고관리자 0 Comments 1 Views 20-11-10 15:46 기계본문
- 분야 : 기타 개발상태 5 9
기술완성도
-
TRL09
사업화
- 본격적인 양산 및 사업화 단계
-
TRL08
시작품 인증/
표준화- 일부 시제품의 인증 및 인허가 취득 단계
- 조선 기자재의 경우 선급기관 인증, 의약품의 경우 식약청의 품목 허가 등
- 일부 시제품의 인증 및 인허가 취득 단계
-
TRL07
Pilot 단계 시작품
신뢰성 평가- 시작품의 신뢰성 평가
- 실제 환경(수요기업)에서 성능 검증이 이루어지는 단계
-
TRL06
Pilot 단계 시작품
성능 평가- 경제성(생산성)을 고려한, 파일로트 규모의 시작품 제작 및 평가
- 시작품 성능평가
-
TRL05
시제품 제작/
성능평가- 개발한 부품/시스템의 시작품(Prototype) 제작 및 성능 평가
- 경제성(생산성)을 고려하지 않고, 우수한 시작품을 1개~수개 미만으로 개발
-
TRL04
연구실 규모의
부품/시스템 성능평가- 연구실 규모의 부품/시스템 성능 평가가 완료된 단계
- 실용화를 위한 핵심요소기술 확보
-
TRL03
연구실 규모의
성능 검증- 연구실/실험실 규모의 환경에서 기본 성능이 검증될 수 있는 단계
- 개발하려는 시스템/부품의 기본 설계도면을 확보하는 단계
- 모델링/설계기술 확보
-
TRL02
실용 목적의 아이디어/
특허 등 개념 정립- 실용 목적의 아이디어, 특허 등 개념 정립
-
TRL01
기초 이론/
실험- 연구과제 탐색 및 기회 발굴 단계
- 키워드
-
빅데이터, 연관 단어, 형태소 분석, 재귀적 분석, 어절 벡터, 검색 단어, 후보 단어, 연관성, 맵리듀스
- 기술 개요
-
본 기술은 연관 단어 추출 기술에 관한 것으로서, 빅 데이터 처리 기술을 이용하여 검색 단어와 의미적 연관성이 높은 연관 단어들을 효율적으로 추출할 수 있는 연관 단어 추출 방법 및 그 시스템에 관한 기술임
[연관 단어 추출 시스템]
- 기술 개요
-
특히, 빅 데이터 처리 기술을 이용하여 검색 단어와 의미적 연관성이 높은 연관 단어들을 추출할 수 있는 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템을 제공함
[연관단어 추출을 위한 방법]
- 시장 동향
-
국내 빅데이터 시장의 성장은 기업을 중심으로 데이터 인프라 및 분석 도구와 자체 플랫폼을 활용한 데이터 분석 솔루션 수요가 산업 전반에 확대되고 있음
한국IDC가 발간한 ‘국내 빅데이터 및 분석도구 시장 전망 보고서 2022~2026)'에 따르면 22년 국내 빅데이터 및 분석 도구 시장은 전년대비 9.9% 성장한 2조 3,302억 원의 매출 규모를 형성할 것으로 전망됨
이 시장은 향후 5년간 연평균 성장률 6.9%를 기록, 2026년까지 3조 2,485억원 규모에 이를 전망임[빅데이터 기반 분석도구 시장 전망]
- 시장 적용 분야
-
[화자에 대한 감정 분석 기술]
- 시장 적용 분야
-
[통역, 번역, 작문, 해석 등의 기술에의 활용]
- 시장 적용 분야
-
[통역, 번역, 작문, 해석 등의 기술에의 활용]
- 특장점
-
- 배경 기술 및 문제점
- 데이터가 많아 짐에 따라 사용자는 수많은 정보를 검색할 수 있지만 필요한 정보를 빠르게 찾기 어려움
사용자의 관심 분야를 파악하려면 사용자의 검색 패턴을 관찰하여 관련된 정보를 프로파일에 작성을 해야 하기 때문에 사용자의 프로파일이 작성되기 전 초기에는 사용자의 관심 분야에 관한 연관 단어를 추출하는데 어려움이 여전히 존재함
- 기술 내용 및 우수성
- 빅 데이터 처리 기술을 이용하여 검색 단어와 의미적 연관성이 높은 연관 단어들을 추출할 수 있는 빅 데이터 처리 기술을 이용한 연관 단어 추출이 가능함
빅 데이터 처리 플랫폼을 이용하여 분산 환경에서 수행함으로써, 대량의 데이터를 효율적으로 처리하고, 연관 단어의 추출 효율성을 향상시킬 수 있음