문서 요약 시스템 및 그 요약 방법
페이지 정보
최고관리자 0 Comments 1 Views 20-11-10 15:46 기계본문
- 분야 : 기타 개발상태 5 9
기술완성도
-
TRL09
사업화
- 본격적인 양산 및 사업화 단계
-
TRL08
시작품 인증/
표준화- 일부 시제품의 인증 및 인허가 취득 단계
- 조선 기자재의 경우 선급기관 인증, 의약품의 경우 식약청의 품목 허가 등
- 일부 시제품의 인증 및 인허가 취득 단계
-
TRL07
Pilot 단계 시작품
신뢰성 평가- 시작품의 신뢰성 평가
- 실제 환경(수요기업)에서 성능 검증이 이루어지는 단계
-
TRL06
Pilot 단계 시작품
성능 평가- 경제성(생산성)을 고려한, 파일로트 규모의 시작품 제작 및 평가
- 시작품 성능평가
-
TRL05
시제품 제작/
성능평가- 개발한 부품/시스템의 시작품(Prototype) 제작 및 성능 평가
- 경제성(생산성)을 고려하지 않고, 우수한 시작품을 1개~수개 미만으로 개발
-
TRL04
연구실 규모의
부품/시스템 성능평가- 연구실 규모의 부품/시스템 성능 평가가 완료된 단계
- 실용화를 위한 핵심요소기술 확보
-
TRL03
연구실 규모의
성능 검증- 연구실/실험실 규모의 환경에서 기본 성능이 검증될 수 있는 단계
- 개발하려는 시스템/부품의 기본 설계도면을 확보하는 단계
- 모델링/설계기술 확보
-
TRL02
실용 목적의 아이디어/
특허 등 개념 정립- 실용 목적의 아이디어, 특허 등 개념 정립
-
TRL01
기초 이론/
실험- 연구과제 탐색 및 기회 발굴 단계
- 키워드
-
형태소 분석, 태그, 개체명, 임베딩, 어절 벡터, 주목 가중치, 은닉, 문맥, 확률, 문서요약, Pgen
- 기술 개요
-
본 기술은 문장을 추출하거나 새로운 문장을 생성하는 문서 요약 시스템 및 요약 방법에 관한 기술
[문서 요약 시스템의 블록도]
- 기술 개요
-
특히, 태그 정보 기반의 PG-Net 모델과, 한 어절이 어근 및 접사로 구성되는 한국어의 특징을 반영하기 위해 형태소 및 개체명 단위의 임베딩 학습 방법론을 반영한 문서 요약 기술을 제공함
본 기술은 단어들의 문맥적 요소와 한국어만의 특징을 고려하여 단어 간의 관계성을 보다 확실하게 정의함으로써 요약문을 도출하는 문서 요약 시스템 및 방법을 제공함
- 시장 동향
-
전 세계적으로 빠른 IT 반등이 시장 수익에 영향을 미치는 가운데 기업은 지능형 문서 처리, 프로세스 마이닝 및 대화형 AI에 대한 투자를 늘리고 있음. 기술 발전과 비즈니스 서비스 붐은 특히 프로세스 발견 및 마이닝에서 광범위한 자동화 기술의 채택을 촉진하고 있음
글로벌 통계 플랫폼 스태티스타에 따르면 글로벌 NLP 관련 시장은 지난해 175억달러(약 25조1090억원)에서 2025년 433억달러(62조1138억원)로 급격히 커질 전망임[NLP 관련 시장]
- 시장 적용 분야
-
[통역, 번역 기술에의 활용]
- 시장 적용 분야
-
[ 음성인식 기술(스피치투 텍스트), (텍스트투 스피치)]
- 특장점
-
- 배경 기술 및 문제점
- 인터넷 사용자들이 접근할 수 있는 텍스트가 많지만, 사용자들이 원하는 텍스트를 검색하고 선택하는 데 어려움을 겪을 수 있음
이에 따라, 사용자에게 편의성을 제공하고자 방대한 텍스트를 간단한 요약 형태로 생성해주는 문서 요약 기법이 등장함
- 기술 내용 및 우수성
- 태그 정보 기반의 PG-Net 모델과, 한 어절이 어근 및 접사로 구성되는 한국어의 특징을 반영하기 위해 형태소 및 개체명 단위의 임베딩 학습 방법론을 반영한 문서 요약 시스템 및 요약 방법을 제공함
단어들의 문맥적 요소와 한국어만의 특징을 고려하여 단어 간의 관계성을 보다 확실하게 정의함으로써 요약문을 도출함