일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
- list map
- DiffUtil.ItemCallback
- ChatGPT
- ktor api call
- llm
- kotlin collection
- Python
- android
- build with ai
- kotlin list
- android exoplayer
- android custom view
- 독서
- map
- 유튜브
- 시행착오
- ListAdapter
- AWS EC2
- exoplayer cache
- video caching
- ListAdapter DiffUtil
- ansi2html
- getChangePayload
- FastAPI
- android ktor
- doc2vec
- 안드로이드
- ExoPlayer
- 스피너
- ktor client
- Today
- Total
목록doc2vec (2)
버튼 수집상
Elastic Search Search API 결과 { 'took': 5, 'timed_out': False, '_shards': { 'total': 1, 'successful': 1, 'skipped': 0, 'failed': 0 }, 'hits': { 'total': { 'value': 1, 'relation': 'eq' }, 'max_score': 1.0, 'hits': [ { '_index': 'INDEX_NAME', '_id': 'ID', '_score': 1.0, '_source': { 'item_idx': 4561, 'subject': '글 제목 예시', 'contents': "글 내용 예시입니다. 보통 이것보다도 줄줄이 길게 들어갑니다.", 'author_nick': '작성자명', 'cre..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bl7oUK/btsyFlQ538c/0KVZao1k55YtigjSeFDBkk/img.png)
순서 1. 데이터셋 준비 2. 형태소 분석 (Tokenization) - 한글 형태소 분석기 nori, konlpy - Elasticsearch 의 REST api 사용하거나 파이썬 모듈 사용 - Elasticsearch 콘솔 홈 > Dev Tools 에서 REST api 테스트 가능 3. 단어장 (Vocabulary) - 빈 단어장 생성 - 형태소 분석이 완료된 텍스트 데이터를 단어장에 업데이트 - 중복 제거하고 각 토큰마다 식별ID 부여 4. 단어 임베딩 (Embedding) - 모델: Word2Vec, FastText, gensim 등 - 토큰화된 텍스트를 위 모델들에게 학습시켜서 벡터 얻기 Elasticsearch 용어집 SQL Elasticsearch Database Index Table x R..