'doc2vec' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/04 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록doc2vec (2)

버튼 수집상

[Elastic Search] 한글 문장 벡터화해서 유사한 문장 찾기 알고리즘 구현 - 2

Elastic Search Search API 결과 { 'took': 5, 'timed_out': False, '_shards': { 'total': 1, 'successful': 1, 'skipped': 0, 'failed': 0 }, 'hits': { 'total': { 'value': 1, 'relation': 'eq' }, 'max_score': 1.0, 'hits': [ { '_index': 'INDEX_NAME', '_id': 'ID', '_score': 1.0, '_source': { 'item_idx': 4561, 'subject': '글 제목 예시', 'contents': "글 내용 예시입니다. 보통 이것보다도 줄줄이 길게 들어갑니다.", 'author_nick': '작성자명', 'cre..

TIL - Elastic Search 2023. 11. 21. 16:59

[Elastic Search] 한글 문장 벡터화해서 유사한 문장 찾기 알고리즘 구현 - 1

순서 1. 데이터셋 준비 2. 형태소 분석 (Tokenization) - 한글 형태소 분석기 nori, konlpy - Elasticsearch 의 REST api 사용하거나 파이썬 모듈 사용 - Elasticsearch 콘솔 홈 > Dev Tools 에서 REST api 테스트 가능 3. 단어장 (Vocabulary) - 빈 단어장 생성 - 형태소 분석이 완료된 텍스트 데이터를 단어장에 업데이트 - 중복 제거하고 각 토큰마다 식별ID 부여 4. 단어 임베딩 (Embedding) - 모델: Word2Vec, FastText, gensim 등 - 토큰화된 텍스트를 위 모델들에게 학습시켜서 벡터 얻기 Elasticsearch 용어집 SQL Elasticsearch Database Index Table x R..

TIL - Elastic Search 2023. 10. 17. 20:35

이전 Prev 1 Next 다음

목록doc2vec (2)

버튼 수집상

티스토리툴바