μΌ | μ | ν | μ | λͺ© | κΈ | ν |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- νκ΅μ΄μλ² λ©
- μνμ½λ©
- μκ³ λ¦¬μ¦
- νμ΄νλ
- μΈνλ°
- μ νλμν
- λ°μ΄ν°λΆμ
- κΉν
- λΆμ
- λ°μ΄ν°
- c++
- λ€μ΄ν°λΈ
- 리μ‘νΈ
- cs231n
- Kaggle
- λ₯λ¬λ
- κ²°μ νΈλ¦¬
- native
- linearalgebra
- react
- μλλ‘μ΄λμ€νλμ€
- λ°±μ€
- λμ
- Titanic
- AI
- μλ² λ©
- Git
- nlp
- λ¨Έμ λ¬λ
- λ°μ΄ν°μκ°ν
- Today
- Total
λͺ©λ‘λμ (5)
yeon's π©π»π»
3μ₯. νκ΅μ΄ μ μ²λ¦¬ κ΅μ¬μμ μ¬μ©νλ νκ΅μ΄ λ°μ΄ν°μ - νκ΅μ΄ μν€ λ°±κ³Ό - KorQuAD - λ€μ΄λ² μν 리뷰 λ§λμΉ 3.2 μ§λ νμ΅ κΈ°λ° ννμ λΆμ νκ΅μ΄λ μ‘°μ¬μ μ΄λ―Έκ° λ°λ¬λμ΄ μκΈ° λλ¬Έμ νλμ λμ¬μ΄μ§λ§ λ€μνκ² νμ©λ μ μλ€. ex) κ°κ² λ€, κ°λλΌ λ°λΌμ μλ‘μ΄ νμ©νμ΄ λνλ λλ§λ€ μ΄ν μ§ν©μ κ³μ λλ €μΌ νλ λ¨μ μ΄ μλ€. -> μ΄λ₯Ό ν΄κ²°νκΈ° μν΄ ννμ λΆμ κΈ°λ²μ μ¬μ©νλ€. κ°κ² λ€ > κ°, κ² , λ€ κ°λλΌ > κ°, λλΌ λ§μ½ μΆκ°λ‘ 'κ°κ² λλΌ' λΌλ νμ©νμ΄ λ§λμΉμ μΆκ°λμλ€κ³ κ°μ νμ. 'κ°κ² λλΌ'λ 'κ°, κ² , λλΌ'λ‘ λΆμλκΈ° λλ¬Έμ μ΄νμ§ν©μ μμ νμ§ μκ³ λ 'κ°κ² λλΌ' λΌλ νμ©νμ μ²λ¦¬ν μ μκ² λλ€. κ΅μ°©μ΄μΈ νκ΅μ΄λ νμ λ μ’ λ₯μ μ‘°μ¬μ μ΄λ―Έλ₯Ό μ¬μ©νκΈ° ..

2.4 μ΄λ€ λ¨μ΄κ° κ°μ΄ μ°μλκ° 2.4.1 λΆν¬ κ°μ λΆν¬(distribution): νΉμ λ²μ, μ¦ μλμ°(window) λ΄μ λμμ λ±μ₯νλ λ¨μ΄μ μ΄μ λ¨μ΄ or λ¬Έλ§₯μ μ§ν© λΆν¬ κ°μ μ μ μ - μ΄λ€ λ¨μ΄ μμ΄ λΉμ·ν λ¬Έλ§₯ νκ²½μμ μμ£Ό λ±μ₯νλ€λ©΄, κ·Έ μλ―Έ λν μ μ¬ν κ²μ΄λ€. - 'λ¨μ΄μ μλ―Έλ κ³§ κ·Έ μΈμ΄μμμ νμ©μ΄λ€' ex) 'λΉ¨λ' μ 'μΈν'μ λ¨μ΄μ μλ―Έλ₯Ό νμ νκΈ° μν΄μ -> λ¬Έμ λ΄ μ£Όλ³μ λ±μ₯νλ λ¬Έλ§₯ λ¨μ΄λ₯Ό ν΅ν΄ νμΈν κ²°κ³Ό μ΄μν λ¨μ΄λ€μ΄ μλ‘ λΉμ·νκΈ° λλ¬Έμ νκΉ λ¨μ΄('λΉ¨λ', 'μΈν') λν λΉμ·ν μλ―ΈλΌκ³ μ¬κΈ΄λ€. But, κ°λ³ λ¨μ΄μ λΆν¬ μ 보μ κ·Έ μλ―Έ μ¬μ΄μ λ Όλ¦¬μ μΌλ‘ μ§μ μ μΈ μ°κ΄μ±μ΄ μμ΄λ³΄μ΄μ§ μλλ€. -> λΆν¬ μ λ³΄κ° κ³§ μλ―ΈλΌλ λΆν¬ κ°μ μ μλ¬Έμ μ΄ μ ..

2.1 μμ°μ΄ κ³μ°κ³Ό μ΄ν΄ μλ² λ©μ μμ°μ΄ μλ―Έλ₯Ό μ΄λ»κ² ν¨μΆν κΉ. - μμ°μ΄μ ν΅κ³μ ν¨ν΄ μ 보λ₯Ό ν΅μ§Έλ‘ μλ² λ©μ λ£μ. μλ² λ©μ λ§λ€ λ μ°λ ν΅κ³ μ 보 1) λ¬Έμ₯μ μ΄λ€ λ¨μ΄κ° (λ§μ΄) μ°μλμ§ 2) λ¨μ΄κ° μ΄λ€ μμλ‘ λ±μ₯νλμ§ 3) λ¬Έμ₯μ μ΄λ€ λ¨μ΄κ° κ°μ΄ λνλ¬λμ§ λ°±μ€λΈμμ¦ κ°μ μΈμ΄ λͺ¨λΈ λΆν¬ κ°μ λ΄μ© μ΄λ€ λ¨μ΄κ° (λ§μ΄) μ°μλκ° λ¨μ΄κ° μ΄λ€ μμλ‘ μ°μλκ° μ΄λ€ λ¨μ΄κ° κ°μ΄ μ°μλκ° λν ν΅κ³λ TF-IDF PMI λν λͺ¨λΈ Deep Averaging Network ELMo, GPT Word2Vec * λ°±μ€λΈμμ¦(bag of words) κ°μ - μ΄λ€ λ¨μ΄κ° (λ§μ΄) μ°μλμ§ μ 보λ₯Ό μ€μ - μ μμ μλλ λ¨μ΄ μ¬μ© μ¬λΆ or κ·Έ λΉλμμ λλ¬λλ€κ³ κ°μ - λ¨μ΄μ μμ μ 보λ 무μ ..
1.3 μλ² λ© κΈ°λ²μ μμ¬μ μ’ λ₯ 1.3.1 ν΅κ³ κΈ°λ°μμ λ΄λ΄ λ€νΈμν¬ κΈ°λ°μΌλ‘ μ΄κΈ° μλ² λ© κΈ°λ²: μ μ¬ μλ―Έ λΆμ(Latent Semantic Analysis) : λ¨μ΄ μ¬μ© λΉλ λ± λ§λμΉμ ν΅κ³λ μ λ³΄κ° λ€μ΄ μλ 컀λ€λ νλ ¬μ νΉμ΄κ° λΆν΄(SVD) λ± μνμ κΈ°λ²μ μ μ©ν΄ νλ ¬μ μν 벑ν°λ€μ μ°¨μμ μΆμνλ λ°©λ² -> μ΄ κ²°κ³Όλ‘ λ§λμΉμ μ£Όμ λ₯Ό μΆμΆν μ μλ€. ex) λ¨μ΄-λ¬Έμ νλ ¬μ μ μ¬ μλ―Έ λΆμμ μ μ© - λλΆλΆμ νλ ¬μ ν¬μ νλ ¬(λλΆλΆμ μμ κ°μ΄ 0μΈ νλ ¬)μΈλ°, μ΄λ° ν¬μ νλ ¬μ΄ λ€λ₯Έ λͺ¨λΈμ μ λ ₯κ°μΌλ‘ μ°μ΄κ² λλ©΄ κ³μ°λ, λ©λͺ¨λ¦¬ μλΉλμ΄ λ무 μ»€μ§ -> μ΄λ° μ΄μ λ‘ μλ νλ ¬μ μ°¨μμ μΆμν λ€ μ¬μ©νλ€. - λ¨μ΄ or λ¬Έμλ₯Ό κΈ°μ€μΌλ‘ μ°¨μμ μΆμν μ μμ - λ¨μ΄ κΈ°μ€μΌλ‘ ..