๐Ÿšดโ€โ™‚๏ธ
TIL
  • MAIN
  • : TIL?
  • : WIL
  • : Plan
  • : Retrospective
    • 21Y
      • Wait a moment!
      • 9M 2W
      • 9M1W
      • 8M4W
      • 8M3W
      • 8M2W
      • 8M1W
      • 7M4W
      • 7M3W
      • 7M2W
      • 7M1W
      • 6M5W
      • 1H
    • ์ƒˆ์‚ฌ๋žŒ ๋˜๊ธฐ ํ”„๋กœ์ ํŠธ
      • 2ํšŒ์ฐจ
      • 1ํšŒ์ฐจ
  • TIL : ML
    • Paper Analysis
      • BERT
      • Transformer
    • Boostcamp 2st
      • [S]Data Viz
        • (4-3) Seaborn ์‹ฌํ™”
        • (4-2) Seaborn ๊ธฐ์ดˆ
        • (4-1) Seaborn ์†Œ๊ฐœ
        • (3-4) More Tips
        • (3-3) Facet ์‚ฌ์šฉํ•˜๊ธฐ
        • (3-2) Color ์‚ฌ์šฉํ•˜๊ธฐ
        • (3-1) Text ์‚ฌ์šฉํ•˜๊ธฐ
        • (2-3) Scatter Plot ์‚ฌ์šฉํ•˜๊ธฐ
        • (2-2) Line Plot ์‚ฌ์šฉํ•˜๊ธฐ
        • (2-1) Bar Plot ์‚ฌ์šฉํ•˜๊ธฐ
        • (1-3) Python๊ณผ Matplotlib
        • (1-2) ์‹œ๊ฐํ™”์˜ ์š”์†Œ
        • (1-1) Welcome to Visualization (OT)
      • [P]MRC
        • (2๊ฐ•) Extraction-based MRC
        • (1๊ฐ•) MRC Intro & Python Basics
      • [P]KLUE
        • (5๊ฐ•) BERT ๊ธฐ๋ฐ˜ ๋‹จ์ผ ๋ฌธ์žฅ ๋ถ„๋ฅ˜ ๋ชจ๋ธ ํ•™์Šต
        • (4๊ฐ•) ํ•œ๊ตญ์–ด BERT ์–ธ์–ด ๋ชจ๋ธ ํ•™์Šต
        • [NLP] ๋ฌธ์žฅ ๋‚ด ๊ฐœ์ฒด๊ฐ„ ๊ด€๊ณ„ ์ถ”์ถœ
        • (3๊ฐ•) BERT ์–ธ์–ด๋ชจ๋ธ ์†Œ๊ฐœ
        • (2๊ฐ•) ์ž์—ฐ์–ด์˜ ์ „์ฒ˜๋ฆฌ
        • (1๊ฐ•) ์ธ๊ณต์ง€๋Šฅ๊ณผ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ
      • [U]Stage-CV
      • [U]Stage-NLP
        • 7W Retrospective
        • (10๊ฐ•) Advanced Self-supervised Pre-training Models
        • (09๊ฐ•) Self-supervised Pre-training Models
        • (08๊ฐ•) Transformer (2)
        • (07๊ฐ•) Transformer (1)
        • 6W Retrospective
        • (06๊ฐ•) Beam Search and BLEU score
        • (05๊ฐ•) Sequence to Sequence with Attention
        • (04๊ฐ•) LSTM and GRU
        • (03๊ฐ•) Recurrent Neural Network and Language Modeling
        • (02๊ฐ•) Word Embedding
        • (01๊ฐ•) Intro to NLP, Bag-of-Words
        • [ํ•„์ˆ˜ ๊ณผ์ œ 4] Preprocessing for NMT Model
        • [ํ•„์ˆ˜ ๊ณผ์ œ 3] Subword-level Language Model
        • [ํ•„์ˆ˜ ๊ณผ์ œ2] RNN-based Language Model
        • [์„ ํƒ ๊ณผ์ œ] BERT Fine-tuning with transformers
        • [ํ•„์ˆ˜ ๊ณผ์ œ] Data Preprocessing
      • Mask Wear Image Classification
        • 5W Retrospective
        • Report_Level1_6
        • Performance | Review
        • DAY 11 : HardVoting | MultiLabelClassification
        • DAY 10 : Cutmix
        • DAY 9 : Loss Function
        • DAY 8 : Baseline
        • DAY 7 : Class Imbalance | Stratification
        • DAY 6 : Error Fix
        • DAY 5 : Facenet | Save
        • DAY 4 : VIT | F1_Loss | LrScheduler
        • DAY 3 : DataSet/Lodaer | EfficientNet
        • DAY 2 : Labeling
        • DAY 1 : EDA
        • 2_EDA Analysis
      • [P]Stage-1
        • 4W Retrospective
        • (10๊ฐ•) Experiment Toolkits & Tips
        • (9๊ฐ•) Ensemble
        • (8๊ฐ•) Training & Inference 2
        • (7๊ฐ•) Training & Inference 1
        • (6๊ฐ•) Model 2
        • (5๊ฐ•) Model 1
        • (4๊ฐ•) Data Generation
        • (3๊ฐ•) Dataset
        • (2๊ฐ•) Image Classification & EDA
        • (1๊ฐ•) Competition with AI Stages!
      • [U]Stage-3
        • 3W Retrospective
        • PyTorch
          • (10๊ฐ•) PyTorch Troubleshooting
          • (09๊ฐ•) Hyperparameter Tuning
          • (08๊ฐ•) Multi-GPU ํ•™์Šต
          • (07๊ฐ•) Monitoring tools for PyTorch
          • (06๊ฐ•) ๋ชจ๋ธ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ
          • (05๊ฐ•) Dataset & Dataloader
          • (04๊ฐ•) AutoGrad & Optimizer
          • (03๊ฐ•) PyTorch ํ”„๋กœ์ ํŠธ ๊ตฌ์กฐ ์ดํ•ดํ•˜๊ธฐ
          • (02๊ฐ•) PyTorch Basics
          • (01๊ฐ•) Introduction to PyTorch
      • [U]Stage-2
        • 2W Retrospective
        • DL Basic
          • (10๊ฐ•) Generative Models 2
          • (09๊ฐ•) Generative Models 1
          • (08๊ฐ•) Sequential Models - Transformer
          • (07๊ฐ•) Sequential Models - RNN
          • (06๊ฐ•) Computer Vision Applications
          • (05๊ฐ•) Modern CNN - 1x1 convolution์˜ ์ค‘์š”์„ฑ
          • (04๊ฐ•) Convolution์€ ๋ฌด์—‡์ธ๊ฐ€?
          • (03๊ฐ•) Optimization
          • (02๊ฐ•) ๋‰ด๋Ÿด ๋„คํŠธ์›Œํฌ - MLP (Multi-Layer Perceptron)
          • (01๊ฐ•) ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ณธ ์šฉ์–ด ์„ค๋ช… - Historical Review
        • Assignment
          • [ํ•„์ˆ˜ ๊ณผ์ œ] Multi-headed Attention Assignment
          • [ํ•„์ˆ˜ ๊ณผ์ œ] LSTM Assignment
          • [ํ•„์ˆ˜ ๊ณผ์ œ] CNN Assignment
          • [ํ•„์ˆ˜ ๊ณผ์ œ] Optimization Assignment
          • [ํ•„์ˆ˜ ๊ณผ์ œ] MLP Assignment
      • [U]Stage-1
        • 1W Retrospective
        • AI Math
          • (AI Math 10๊ฐ•) RNN ์ฒซ๊ฑธ์Œ
          • (AI Math 9๊ฐ•) CNN ์ฒซ๊ฑธ์Œ
          • (AI Math 8๊ฐ•) ๋ฒ ์ด์ฆˆ ํ†ต๊ณ„ํ•™ ๋ง›๋ณด๊ธฐ
          • (AI Math 7๊ฐ•) ํ†ต๊ณ„ํ•™ ๋ง›๋ณด๊ธฐ
          • (AI Math 6๊ฐ•) ํ™•๋ฅ ๋ก  ๋ง›๋ณด๊ธฐ
          • (AI Math 5๊ฐ•) ๋”ฅ๋Ÿฌ๋‹ ํ•™์Šต๋ฐฉ๋ฒ• ์ดํ•ดํ•˜๊ธฐ
          • (AI Math 4๊ฐ•) ๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ• - ๋งค์šด๋ง›
          • (AI Math 3๊ฐ•) ๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ• - ์ˆœํ•œ๋ง›
          • (AI Math 2๊ฐ•) ํ–‰๋ ฌ์ด ๋ญ์˜ˆ์š”?
          • (AI Math 1๊ฐ•) ๋ฒกํ„ฐ๊ฐ€ ๋ญ์˜ˆ์š”?
        • Python
          • (Python 7-2๊ฐ•) pandas II
          • (Python 7-1๊ฐ•) pandas I
          • (Python 6๊ฐ•) numpy
          • (Python 5-2๊ฐ•) Python data handling
          • (Python 5-1๊ฐ•) File / Exception / Log Handling
          • (Python 4-2๊ฐ•) Module and Project
          • (Python 4-1๊ฐ•) Python Object Oriented Programming
          • (Python 3-2๊ฐ•) Pythonic code
          • (Python 3-1๊ฐ•) Python Data Structure
          • (Python 2-4๊ฐ•) String and advanced function concept
          • (Python 2-3๊ฐ•) Conditionals and Loops
          • (Python 2-2๊ฐ•) Function and Console I/O
          • (Python 2-1๊ฐ•) Variables
          • (Python 1-3๊ฐ•) ํŒŒ์ด์ฌ ์ฝ”๋”ฉ ํ™˜๊ฒฝ
          • (Python 1-2๊ฐ•) ํŒŒ์ด์ฌ ๊ฐœ์š”
          • (Python 1-1๊ฐ•) Basic computer class for newbies
        • Assignment
          • [์„ ํƒ ๊ณผ์ œ 3] Maximum Likelihood Estimate
          • [์„ ํƒ ๊ณผ์ œ 2] Backpropagation
          • [์„ ํƒ ๊ณผ์ œ 1] Gradient Descent
          • [ํ•„์ˆ˜ ๊ณผ์ œ 5] Morsecode
          • [ํ•„์ˆ˜ ๊ณผ์ œ 4] Baseball
          • [ํ•„์ˆ˜ ๊ณผ์ œ 3] Text Processing 2
          • [ํ•„์ˆ˜ ๊ณผ์ œ 2] Text Processing 1
          • [ํ•„์ˆ˜ ๊ณผ์ œ 1] Basic Math
    • ๋”ฅ๋Ÿฌ๋‹ CNN ์™„๋ฒฝ ๊ฐ€์ด๋“œ - Fundamental ํŽธ
      • ์ข…ํ•ฉ ์‹ค์Šต 2 - ์บ๊ธ€ Plant Pathology(๋‚˜๋ฌด์žŽ ๋ณ‘ ์ง„๋‹จ) ๊ฒฝ์—ฐ ๋Œ€ํšŒ
      • ์ข…ํ•ฉ ์‹ค์Šต 1 - 120์ข…์˜ Dog Breed Identification ๋ชจ๋ธ ์ตœ์ ํ™”
      • ์‚ฌ์ „ ํ›ˆ๋ จ ๋ชจ๋ธ์˜ ๋ฏธ์„ธ ์กฐ์ • ํ•™์Šต๊ณผ ๋‹ค์–‘ํ•œ Learning Rate Scheduler์˜ ์ ์šฉ
      • Advanced CNN ๋ชจ๋ธ ํŒŒํ—ค์น˜๊ธฐ - ResNet ์ƒ์„ธ์™€ EfficientNet ๊ฐœ์š”
      • Advanced CNN ๋ชจ๋ธ ํŒŒํ—ค์น˜๊ธฐ - AlexNet, VGGNet, GoogLeNet
      • Albumentation์„ ์ด์šฉํ•œ Augmentation๊ธฐ๋ฒ•๊ณผ Keras Sequence ํ™œ์šฉํ•˜๊ธฐ
      • ์‚ฌ์ „ ํ›ˆ๋ จ CNN ๋ชจ๋ธ์˜ ํ™œ์šฉ๊ณผ Keras Generator ๋ฉ”์ปค๋‹ˆ์ฆ˜ ์ดํ•ด
      • ๋ฐ์ดํ„ฐ ์ฆ๊ฐ•์˜ ์ดํ•ด - Keras ImageDataGenerator ํ™œ์šฉ
      • CNN ๋ชจ๋ธ ๊ตฌํ˜„ ๋ฐ ์„ฑ๋Šฅ ํ–ฅ์ƒ ๊ธฐ๋ณธ ๊ธฐ๋ฒ• ์ ์šฉํ•˜๊ธฐ
    • AI School 1st
    • ํ˜„์—… ์‹ค๋ฌด์ž์—๊ฒŒ ๋ฐฐ์šฐ๋Š” Kaggle ๋จธ์‹ ๋Ÿฌ๋‹ ์ž…๋ฌธ
    • ํŒŒ์ด์ฌ ๋”ฅ๋Ÿฌ๋‹ ํŒŒ์ดํ† ์น˜
  • TIL : Python & Math
    • Do It! ์žฅ๊ณ +๋ถ€ํŠธ์ŠคํŠธ๋žฉ: ํŒŒ์ด์ฌ ์›น๊ฐœ๋ฐœ์˜ ์ •์„
      • Relations - ๋‹ค๋Œ€๋‹ค ๊ด€๊ณ„
      • Relations - ๋‹ค๋Œ€์ผ ๊ด€๊ณ„
      • ํ…œํ”Œ๋ฆฟ ํŒŒ์ผ ๋ชจ๋“ˆํ™” ํ•˜๊ธฐ
      • TDD (Test Driven Development)
      • template tags & ์กฐ๊ฑด๋ฌธ
      • ์ •์  ํŒŒ์ผ(static files) & ๋ฏธ๋””์–ด ํŒŒ์ผ(media files)
      • FBV (Function Based View)์™€ CBV (Class Based View)
      • Django ์ž…๋ฌธํ•˜๊ธฐ
      • ๋ถ€ํŠธ์ŠคํŠธ๋žฉ
      • ํ”„๋ก ํŠธ์—”๋“œ ๊ธฐ์ดˆ๋‹ค์ง€๊ธฐ (HTML, CSS, JS)
      • ๋“ค์–ด๊ฐ€๊ธฐ + ํ™˜๊ฒฝ์„ค์ •
    • Algorithm
      • Programmers
        • Level1
          • ์†Œ์ˆ˜ ๋งŒ๋“ค๊ธฐ
          • ์ˆซ์ž ๋ฌธ์ž์—ด๊ณผ ์˜๋‹จ์–ด
          • ์ž์—ฐ์ˆ˜ ๋’ค์ง‘์–ด ๋ฐฐ์—ด๋กœ ๋งŒ๋“ค๊ธฐ
          • ์ •์ˆ˜ ๋‚ด๋ฆผ์ฐจ์ˆœ์œผ๋กœ ๋ฐฐ์น˜ํ•˜๊ธฐ
          • ์ •์ˆ˜ ์ œ๊ณฑ๊ทผ ํŒ๋ณ„
          • ์ œ์ผ ์ž‘์€ ์ˆ˜ ์ œ๊ฑฐํ•˜๊ธฐ
          • ์ง์‚ฌ๊ฐํ˜• ๋ณ„์ฐ๊ธฐ
          • ์ง์ˆ˜์™€ ํ™€์ˆ˜
          • ์ฒด์œก๋ณต
          • ์ตœ๋Œ€๊ณต์•ฝ์ˆ˜์™€ ์ตœ์†Œ๊ณต๋ฐฐ์ˆ˜
          • ์ฝœ๋ผ์ธ  ์ถ”์ธก
          • ํฌ๋ ˆ์ธ ์ธํ˜•๋ฝ‘๊ธฐ ๊ฒŒ์ž„
          • ํ‚คํŒจ๋“œ ๋ˆ„๋ฅด๊ธฐ
          • ํ‰๊ท  ๊ตฌํ•˜๊ธฐ
          • ํฐ์ผ“๋ชฌ
          • ํ•˜์ƒค๋“œ ์ˆ˜
          • ํ•ธ๋“œํฐ ๋ฒˆํ˜ธ ๊ฐ€๋ฆฌ๊ธฐ
          • ํ–‰๋ ฌ์˜ ๋ง์…ˆ
        • Level2
          • ์ˆซ์ž์˜ ํ‘œํ˜„
          • ์ˆœ์œ„ ๊ฒ€์ƒ‰
          • ์ˆ˜์‹ ์ตœ๋Œ€ํ™”
          • ์†Œ์ˆ˜ ์ฐพ๊ธฐ
          • ์†Œ์ˆ˜ ๋งŒ๋“ค๊ธฐ
          • ์‚ผ๊ฐ ๋‹ฌํŒฝ์ด
          • ๋ฌธ์ž์—ด ์••์ถ•
          • ๋ฉ”๋‰ด ๋ฆฌ๋‰ด์–ผ
          • ๋” ๋งต๊ฒŒ
          • ๋•…๋”ฐ๋จน๊ธฐ
          • ๋ฉ€์ฉกํ•œ ์‚ฌ๊ฐํ˜•
          • ๊ด„ํ˜ธ ํšŒ์ „ํ•˜๊ธฐ
          • ๊ด„ํ˜ธ ๋ณ€ํ™˜
          • ๊ตฌ๋ช…๋ณดํŠธ
          • ๊ธฐ๋Šฅ ๊ฐœ๋ฐœ
          • ๋‰ด์Šค ํด๋Ÿฌ์Šคํ„ฐ๋ง
          • ๋‹ค๋ฆฌ๋ฅผ ์ง€๋‚˜๋Š” ํŠธ๋Ÿญ
          • ๋‹ค์Œ ํฐ ์ˆซ์ž
          • ๊ฒŒ์ž„ ๋งต ์ตœ๋‹จ๊ฑฐ๋ฆฌ
          • ๊ฑฐ๋ฆฌ๋‘๊ธฐ ํ™•์ธํ•˜๊ธฐ
          • ๊ฐ€์žฅ ํฐ ์ •์‚ฌ๊ฐํ˜• ์ฐพ๊ธฐ
          • H-Index
          • JadenCase ๋ฌธ์ž์—ด ๋งŒ๋“ค๊ธฐ
          • N๊ฐœ์˜ ์ตœ์†Œ๊ณต๋ฐฐ์ˆ˜
          • N์ง„์ˆ˜ ๊ฒŒ์ž„
          • ๊ฐ€์žฅ ํฐ ์ˆ˜
          • 124 ๋‚˜๋ผ์˜ ์ˆซ์ž
          • 2๊ฐœ ์ดํ•˜๋กœ ๋‹ค๋ฅธ ๋น„ํŠธ
          • [3์ฐจ] ํŒŒ์ผ๋ช… ์ •๋ ฌ
          • [3์ฐจ] ์••์ถ•
          • ์ค„ ์„œ๋Š” ๋ฐฉ๋ฒ•
          • [3์ฐจ] ๋ฐฉ๊ธˆ ๊ทธ๊ณก
          • ๊ฑฐ๋ฆฌ๋‘๊ธฐ ํ™•์ธํ•˜๊ธฐ
        • Level3
          • ๋งค์นญ ์ ์ˆ˜
          • ์™ธ๋ฒฝ ์ ๊ฒ€
          • ๊ธฐ์ง€๊ตญ ์„ค์น˜
          • ์ˆซ์ž ๊ฒŒ์ž„
          • 110 ์˜ฎ๊ธฐ๊ธฐ
          • ๊ด‘๊ณ  ์ œ๊ฑฐ
          • ๊ธธ ์ฐพ๊ธฐ ๊ฒŒ์ž„
          • ์…”ํ‹€๋ฒ„์Šค
          • ๋‹จ์†์นด๋ฉ”๋ผ
          • ํ‘œ ํŽธ์ง‘
          • N-Queen
          • ์ง•๊ฒ€๋‹ค๋ฆฌ ๊ฑด๋„ˆ๊ธฐ
          • ์ตœ๊ณ ์˜ ์ง‘ํ•ฉ
          • ํ•ฉ์Šน ํƒ์‹œ ์š”๊ธˆ
          • ๊ฑฐ์Šค๋ฆ„๋ˆ
          • ํ•˜๋…ธ์ด์˜ ํƒ‘
          • ๋ฉ€๋ฆฌ ๋›ฐ๊ธฐ
          • ๋ชจ๋‘ 0์œผ๋กœ ๋งŒ๋“ค๊ธฐ
        • Level4
    • Head First Python
    • ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ์œ„ํ•œ SQL
    • ๋‹จ ๋‘ ์žฅ์˜ ๋ฌธ์„œ๋กœ ๋ฐ์ดํ„ฐ ๋ถ„์„๊ณผ ์‹œ๊ฐํ™” ๋ฝ€๊ฐœ๊ธฐ
    • Linear Algebra(Khan Academy)
    • ์ธ๊ณต์ง€๋Šฅ์„ ์œ„ํ•œ ์„ ํ˜•๋Œ€์ˆ˜
    • Statistics110
  • TIL : etc
    • [๋”ฐ๋ฐฐ๋Ÿฐ] Kubernetes
    • [๋”ฐ๋ฐฐ๋Ÿฐ] Docker
      • 2. ๋„์ปค ์„ค์น˜ ์‹ค์Šต 1 - ํ•™์ŠตํŽธ(์ค€๋น„๋ฌผ/์‹ค์Šต ์œ ํ˜• ์†Œ๊ฐœ)
      • 1. ์ปจํ…Œ์ด๋„ˆ์™€ ๋„์ปค์˜ ์ดํ•ด - ์ปจํ…Œ์ด๋„ˆ๋ฅผ ์“ฐ๋Š”์ด์œ  / ์ผ๋ฐ˜ํ”„๋กœ๊ทธ๋žจ๊ณผ ์ปจํ…Œ์ด๋„ˆํ”„๋กœ๊ทธ๋žจ์˜ ์ฐจ์ด์ 
      • 0. ๋“œ๋””์–ด ์ฐพ์•„์˜จ Docker ๊ฐ•์˜! ์™•์ดˆ๋ณด์—์„œ ๋„์ปค ๋งˆ์Šคํ„ฐ๋กœ - OT
    • CoinTrading
      • [๊ฐ€์ƒ ํ™”ํ ์ž๋™ ๋งค๋งค ํ”„๋กœ๊ทธ๋žจ] ๋ฐฑํ…Œ์ŠคํŒ… : ๊ฐ„๋‹จํ•œ ํ…Œ์ŠคํŒ…
    • Gatsby
      • 01 ๊นƒ๋ถ ํฌ๊ธฐ ์„ ์–ธ
  • TIL : Project
    • Mask Wear Image Classification
    • Project. GARIGO
  • 2021 TIL
    • CHANGED
    • JUN
      • 30 Wed
      • 29 Tue
      • 28 Mon
      • 27 Sun
      • 26 Sat
      • 25 Fri
      • 24 Thu
      • 23 Wed
      • 22 Tue
      • 21 Mon
      • 20 Sun
      • 19 Sat
      • 18 Fri
      • 17 Thu
      • 16 Wed
      • 15 Tue
      • 14 Mon
      • 13 Sun
      • 12 Sat
      • 11 Fri
      • 10 Thu
      • 9 Wed
      • 8 Tue
      • 7 Mon
      • 6 Sun
      • 5 Sat
      • 4 Fri
      • 3 Thu
      • 2 Wed
      • 1 Tue
    • MAY
      • 31 Mon
      • 30 Sun
      • 29 Sat
      • 28 Fri
      • 27 Thu
      • 26 Wed
      • 25 Tue
      • 24 Mon
      • 23 Sun
      • 22 Sat
      • 21 Fri
      • 20 Thu
      • 19 Wed
      • 18 Tue
      • 17 Mon
      • 16 Sun
      • 15 Sat
      • 14 Fri
      • 13 Thu
      • 12 Wed
      • 11 Tue
      • 10 Mon
      • 9 Sun
      • 8 Sat
      • 7 Fri
      • 6 Thu
      • 5 Wed
      • 4 Tue
      • 3 Mon
      • 2 Sun
      • 1 Sat
    • APR
      • 30 Fri
      • 29 Thu
      • 28 Wed
      • 27 Tue
      • 26 Mon
      • 25 Sun
      • 24 Sat
      • 23 Fri
      • 22 Thu
      • 21 Wed
      • 20 Tue
      • 19 Mon
      • 18 Sun
      • 17 Sat
      • 16 Fri
      • 15 Thu
      • 14 Wed
      • 13 Tue
      • 12 Mon
      • 11 Sun
      • 10 Sat
      • 9 Fri
      • 8 Thu
      • 7 Wed
      • 6 Tue
      • 5 Mon
      • 4 Sun
      • 3 Sat
      • 2 Fri
      • 1 Thu
    • MAR
      • 31 Wed
      • 30 Tue
      • 29 Mon
      • 28 Sun
      • 27 Sat
      • 26 Fri
      • 25 Thu
      • 24 Wed
      • 23 Tue
      • 22 Mon
      • 21 Sun
      • 20 Sat
      • 19 Fri
      • 18 Thu
      • 17 Wed
      • 16 Tue
      • 15 Mon
      • 14 Sun
      • 13 Sat
      • 12 Fri
      • 11 Thu
      • 10 Wed
      • 9 Tue
      • 8 Mon
      • 7 Sun
      • 6 Sat
      • 5 Fri
      • 4 Thu
      • 3 Wed
      • 2 Tue
      • 1 Mon
    • FEB
      • 28 Sun
      • 27 Sat
      • 26 Fri
      • 25 Thu
      • 24 Wed
      • 23 Tue
      • 22 Mon
      • 21 Sun
      • 20 Sat
      • 19 Fri
      • 18 Thu
      • 17 Wed
      • 16 Tue
      • 15 Mon
      • 14 Sun
      • 13 Sat
      • 12 Fri
      • 11 Thu
      • 10 Wed
      • 9 Tue
      • 8 Mon
      • 7 Sun
      • 6 Sat
      • 5 Fri
      • 4 Thu
      • 3 Wed
      • 2 Tue
      • 1 Mon
    • JAN
      • 31 Sun
      • 30 Sat
      • 29 Fri
      • 28 Thu
      • 27 Wed
      • 26 Tue
      • 25 Mon
      • 24 Sun
      • 23 Sat
      • 22 Fri
      • 21 Thu
      • 20 Wed
      • 19 Tue
      • 18 Mon
      • 17 Sun
      • 16 Sat
      • 15 Fri
      • 14 Thu
      • 13 Wed
      • 12 Tue
      • 11 Mon
      • 10 Sun
      • 9 Sat
      • 8 Fri
      • 7 Thu
      • 6 Wed
      • 5 Tue
      • 4 Mon
      • 3 Sun
      • 2 Sat
      • 1 Fri
  • 2020 TIL
    • DEC
      • 31 Thu
      • 30 Wed
      • 29 Tue
      • 28 Mon
      • 27 Sun
      • 26 Sat
      • 25 Fri
      • 24 Thu
      • 23 Wed
      • 22 Tue
      • 21 Mon
      • 20 Sun
      • 19 Sat
      • 18 Fri
      • 17 Thu
      • 16 Wed
      • 15 Tue
      • 14 Mon
      • 13 Sun
      • 12 Sat
      • 11 Fri
      • 10 Thu
      • 9 Wed
      • 8 Tue
      • 7 Mon
      • 6 Sun
      • 5 Sat
      • 4 Fri
      • 3 Tue
      • 2 Wed
      • 1 Tue
    • NOV
      • 30 Mon
Powered by GitBook
On this page
  • [AI ์Šค์ฟจ 1๊ธฐ] 7์ฃผ์ฐจ DAY 2
  • Deep Learning: ์‹ ๊ฒฝ๋ง์˜ ๊ธฐ์ดˆ - ๊ธฐ๊ณ„ํ•™์Šต๊ณผ ์ˆ˜ํ•™ I
  • Deep Learning: ์‹ ๊ฒฝ๋ง์˜ ๊ธฐ์ดˆ - ๊ธฐ๊ณ„ํ•™์Šต๊ณผ ์ˆ˜ํ•™ II
  • Deep Learning: ์‹ ๊ฒฝ๋ง์˜ ๊ธฐ์ดˆ - ๊ธฐ๊ณ„ํ•™์Šต๊ณผ ์ˆ˜ํ•™ III
  • Deep Learning: ์‹ ๊ฒฝ๋ง์˜ ๊ธฐ์ดˆ - ์‹ค์Šต I

Was this helpful?

  1. 2021 TIL
  2. JAN

19 Tue

TIL

[AI ์Šค์ฟจ 1๊ธฐ] 7์ฃผ์ฐจ DAY 2

Deep Learning: ์‹ ๊ฒฝ๋ง์˜ ๊ธฐ์ดˆ - ๊ธฐ๊ณ„ํ•™์Šต๊ณผ ์ˆ˜ํ•™ I

๊ธฐ๊ณ„ํ•™์Šต์—์„œ ์ˆ˜ํ•™์˜ ์—ญํ• 

  • ์ˆ˜ํ•™์€ ๋ชฉ์ ํ•จ์ˆ˜๋ฅผ ์ •์˜ํ•˜๊ณ  ๋ชฉ์ ํ•จ์ˆ˜์˜ ์ตœ์ €์ ์„ ์ฐพ์•„์ฃผ๋Š” ์ตœ์ ํ™” ์ด๋ก  ์ œ๊ณต

  • ์ตœ์ ํ™” ์ด๋ก ์— ํ•™์Šต๋ฅ , ๋ฉˆ์ถค์กฐ๊ฑด๊ณผ ๊ฐ™์€ ์ œ์–ด๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ตฌ์ถ•

  • ์‚ฌ๋žŒ์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์„ค๊ณ„ํ•˜๊ณ  ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘

๊ธฐ๋ณธ ์„ ํ˜•๋Œ€์ˆ˜

  • ๋ฐ์ดํ„ฐ๋ฅผ ๋ฒกํ„ฐ, ํ–‰๋ ฌ, ํ…์„œ ๋“ฑ์œผ๋กœ ํ‘œํ˜„ํ•˜๊ณ  ์ด๋ฅผ ๊ณต๊ฐ„์ ์œผ๋กœ ์ดํ•ดํ•ด์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์„ ํ˜•๋Œ€์ˆ˜๋ฅผ ๊ณต๋ถ€ํ•ด์•ผํ•จ.

๋ฒกํ„ฐ

  • ์ƒ˜ํ”Œ์„ ํŠน์ง• ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„

    • EX) ๊ฝƒ๋ฐ›์นจ์˜ ๊ธธ์ด, ๊ฝƒ๋ฐ›์นจ์˜ ๋„ˆ๋น„, ๊ฝƒ์žŽ์˜ ๊ธธ์ด, ๊ฝƒ์žŽ์˜ ๋„ˆ๋น„

    • 4๊ฐœ์˜ ํŠน์ง•์ด ๊ฐ๊ฐ 5.1, 3.5, 1.4, 0.2 ์ธ ์ƒ˜ํ”Œ

  • ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์˜ ์—ฌ๋Ÿฌ ํŠน์ง• ๋ฒกํ„ฐ๋ฅผ ์ฒจ์ž๋กœ ๊ตฌ๋ถ„

    • ๋ฐ์ดํ„ฐ์˜ ์ƒ‰์ธ์„ ์œ„์ฒจ์ž๋กœ ๋˜๋Š” ์•„๋ž˜์ฒจ์ž๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค

    • ์‚ฌ๋žŒ๋งˆ๋‹ค ํ‘œํ˜„ ๋ฐฉ์‹์ด ๋‹ค๋ฅด๋‹ค

ํ–‰๋ ฌ

  • ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๋ฒกํ„ฐ๋ฅผ ๋‹ด์Œ

  • ์š”์†Œ xij x_{ij} xijโ€‹: i๋ฒˆ์งธ ํ–‰, j๋ฒˆ์งธ ์—ด

  • ํ›ˆ๋ จ์ง‘ํ•ฉ์„ ๋‹ด์€ ํ–‰๋ ฌ์„ ์„ค๊ณ„ํ–‰๋ ฌ์ด๋ผ ๋ถ€๋ฆ„

  • ๊ธฐ๋ณธ์ ์œผ๋กœ ํ–‰๋ ฌ์€ ๋Œ€๋ฌธ์ž, ๋ฒกํ„ฐ๋Š” ์†Œ๋ฌธ์ž๋ฅผ ์”€

์ „์น˜ํ–‰๋ ฌ

  • A์˜ ์ „์น˜ํ–‰๋ ฌ์€ ATA^TAT

  • ํ–‰๊ณผ ์—ด์˜ ์ˆœ์„œ๊ฐ€ ๋ฐ”๋€ ํ–‰๋ ฌ

  • ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ํ‘œํ˜„ํ•˜๊ธฐ ์‰ฝ๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด์„œ ์‚ฌ์šฉ

  • (AB)T=BTAT (AB)^T = B^TA^T (AB)T=BTAT

ํ–‰๋ ฌ์„ ์ด์šฉํ•˜๋ฉด ๋ฐฉ์ •์‹์„ ๊ฐ„๊ฒฐํ•˜๊ฒŒ ํ‘œํ˜„ ๊ฐ€๋Šฅ

ํŠน์ˆ˜ ํ–‰๋ ฌ

ํ–‰๋ ฌ ์—ฐ์‚ฐ

  • ๊ณฑ์…ˆ

    • C=ABC = ABC=AB

    • ๊ตํ™˜ ๋ฒ•์น™์€ ์„ฑ๋ฆฝํ•˜์ง€ ์•Š์Œ

    • ๋ถ„๋ฐฐ๋ฒ•์น™๊ณผ ๊ฒฐํ•ฉ๋ฒ•์น™ ์„ฑ๋ฆฝ

  • ๋‚ด์ 

    • C=Aโ‹…B=ATBC = A \cdot B = A^TB C=Aโ‹…B=ATB

    • ๋‘ ๋ฒกํ„ฐ(๋˜๋Š” ํ–‰๋ ฌ)๊ฐ„์˜ ์œ ์‚ฌ์„ฑ์„ ์ธก์ •ํ•˜๋Š” ์—ฐ์‚ฐ

ํ…์„œ

  • 3์ฐจ์› ์ด์ƒ์˜ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ ์ˆซ์ž ๋ฐฐ์—ด

    • 0์ฐจ : ์Šค์นผ๋ผ

    • 1์ฐจ : ๋ฒกํ„ฐ

    • 2์ฐจ : ํ–‰๋ ฌ

์œ ์‚ฌ๋„์™€ ๊ฑฐ๋ฆฌ

  • ๋ฒกํ„ฐ๋ฅผ ๊ธฐํ•˜ํ•™์ ์œผ๋กœ ํ•ด์„

  • ๊ฐ๋„๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๋ฒกํ„ฐ์˜ ์œ ์‚ฌ๋„๋ฅผ ํŒ๋‹จ

  • ์ฝ”์‚ฌ์ธ ์œ ์‚ฌ๋„

๋ฒกํ„ฐ์™€ ํ–‰๋ ฌ์˜ ๊ฑฐ๋ฆฌ๋ฅผ ๋†ˆ์œผ๋กœ ์ธก์ •

  • ๋ฒกํ„ฐ์˜ p์ฐจ ๋†ˆโˆฃโˆฃxโˆฃโˆฃp=(โˆ‘i=1,dโˆฃxiโˆฃp)1p ||x||_p = ( \sum _{i=1,d} |x_i|^p)^{1 \over p} โˆฃโˆฃxโˆฃโˆฃpโ€‹=(โˆ‘i=1,dโ€‹โˆฃxiโ€‹โˆฃp)p1โ€‹

  • ์ตœ๋Œ€ ๋†ˆ : โˆฃโˆฃxโˆฃโˆฃโˆž=max(โˆฃx1โˆฃ,โˆฃx2โˆฃ,โ‹ฏโ€‰,โˆฃxdโˆฃ) ||x||_\infty = max(|x_1|, |x_2|, \cdots ,|x_d|) โˆฃโˆฃxโˆฃโˆฃโˆžโ€‹=max(โˆฃx1โ€‹โˆฃ,โˆฃx2โ€‹โˆฃ,โ‹ฏ,โˆฃxdโ€‹โˆฃ)

  • ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค ๋†ˆ

    • ํ–‰๋ ฌ์˜ ํฌ๊ธฐ๋ฅผ ์ธก์ •

  • ๋†ˆ์— ๋Œ€ํ•ด ํ™•์‹คํ•œ ์ดํ•ด๊ฐ€ ๋˜์—ˆ๋‹ค

ํผ์…‰ํŠธ๋ก 

  • 1958๋…„ ๊ณ ์•ˆ๋œ ๋ถ„๋ฅ˜๊ธฐ ๋ชจ๋ธ

  • ํผ์…‰ํŠธ๋ก ์˜ ๋™์ž‘

    • ๋‚ด์ ์„ ํ†ตํ•ด ์œ ์‚ฌ์„ฑ์„ ํŒ๋‹จ

  • ํ™œ์„ฑ ํ•จ์ˆ˜๋กœ๋Š” ๊ณ„๋‹จํ•จ์ˆ˜ ์‚ฌ์šฉ

ํผ์…‰ํŠธ๋ก ์˜ ๋ฌผ๋ฆฌ์  ์˜๋ฏธ

  • w์— ์ˆ˜์ง์ด๊ณ  ์›์ ์œผ๋กœ๋ถ€ํ„ฐ Tโˆฃโˆฃwโˆฃโˆฃ2 {T \over ||w||_2} โˆฃโˆฃwโˆฃโˆฃ2โ€‹Tโ€‹ ๋งŒํผ ๋–จ์–ด์ ธ ์žˆ์Œ

  • 2์ฐจ์› ๊ณต๊ฐ„์€ ๋‘ ๊ฐœ์˜ ๋ถ€๋ถ„๊ณต๊ฐ„์„ ๋‚˜๋ˆ„๋Š” ๊ฒฐ์ •์ง์„ ์ด ์กด์žฌํ•œ๋‹ค

  • 3์ฐจ์›์€ ๊ฒฐ์ •ํ‰๋ฉด, 4์ฐจ์› ์ด์ƒ์€ ๊ฒฐ์ • ์ดˆํ‰๋ฉด

์—ฌ๋Ÿฌ ํผ์…‰ํŠธ๋ก  ์ถœ๋ ฅ ํ‘œํ˜„ (๋ฉ€ํ‹ฐ ํผ์…‰ํŠธ๋ก )

  • ์ž…๋ ฅ๋ฒกํ„ฐ๊ฐ€ d๊ฐœ๋ฉด ํผ์…‰ํŠธ๋ก  ํ•˜๋‚˜๋งˆ๋‹ค d๊ฐœ์˜ ๊ฐ€์ค‘์น˜์™€ ์ž…๋ ฅ์ด ์กด์žฌํ•œ๋‹ค.

  • ๊ฐ€์ค‘์น˜ ๋ฒกํ„ฐ๋ฅผ ๊ฐ ๋ถ€๋ฅ˜์˜ ๊ธฐ์ค€ ๋ฒกํ„ฐ๋กœ ๊ฐ„์ฃผํ•˜๋ฉด, c๊ฐœ ๋ถ€๋ฅ˜์˜ ์œ ์‚ฌ๋„ ๊ณ„์‚ฐํ•˜๋Š” ๊ฒƒ๊ณผ ๋น„์Šทํ•˜๋‹ค.

ํ•™์Šต์˜ ์ •์˜

  • ์ถ”๋ก 

    • O = f(Wx)

    • W์™€ x๋ฅผ ์•Œ๊ณ  O๋ฅผ ์ถ”๋ก 

  • ํ›ˆ๋ จ

    • O = f(Wx)

    • O์™€ x๋ฅผ ์•Œ๊ณ  W๋ฅผ ์ถ”๋ก 

์„ ํ˜•๊ฒฐํ•ฉ๊ณผ ๋ฒกํ„ฐ๊ณต๊ฐ„

  • ๋ฒกํ„ฐ

    • ๊ณต๊ฐ„์‚ฌ์œผ์ด ํ•œ ์ ์œผ๋กœ ํ™”์‚ดํ‘œ ๋์ด ๋ฒกํ„ฐ์˜ ์ขŒํ‘œ์— ํ•ด๋‹น

  • ์„ ํ˜•๊ฒฐํ•ฉ์ด ๋งŒ๋“œ๋Š” ๋ฒกํ„ฐ๊ณต๊ฐ„

    • c=ฮฑ1a+ฮฑ2b c = \alpha _1a +\alpha _2b c=ฮฑ1โ€‹a+ฮฑ2โ€‹b

    • ์„ ํ˜•๊ฒฐํ•ฉ์œผ๋กœ ๋งŒ๋“ค์–ด์ง„ ๊ณต๊ฐ„์„ ๋ฒกํ„ฐ๊ณต๊ฐ„์ด๋ผ๊ณ  ๋ถ€๋ฆ„

์„ ํ˜•๋ฐฉ์ •์‹์˜ ํ•ด

  • ๋ถˆ๋Šฅ : ํ•ด ์—†์Œ

  • ๋ถ€์ • : ๋‹ค์ˆ˜์˜ ํ•ด ์กด์žฌ

  • ์œ ์ผํ•ด ์กด์žฌ : ์—ญํ–‰๋ ฌ์„ ์ด์šฉํ•˜์—ฌ ํ•ด๋ฅผ ๊ตฌํ•จ

ํ–‰๋ ฌ์‹

  • ์—ญํ–‰๋ ฌ์˜ ์กด์žฌ ์œ ๋ฌด

    • det = 0 : ์—ญํ–‰๋ ฌ ์—†์Œ

    • det != 0 : ์—ญํ–‰๋ ฌ ์กด์žฌ

  • ๊ธฐํ•˜ํ•™์  ์˜๋ฏธ

    • det = 0 : ํ•˜๋‚˜์˜ ์ฐจ์›์„ ๋”ฐ๋ผ์„œ ์ถ•์†Œ๋˜์–ด ๋ถ€ํ”ผ๋ฅผ ์žƒ๊ฒŒ๋จ

    • det = 1 : ๋ถ€ํ”ผ ์œ ์ง€, ๋ฐฉํ–ฅ ๋ณด์กด

    • det = -1 : ๋ถ€ํ”ผ ์œ ์ง€, ๋ฐฉํ–ฅ ๋ณด์กด ์•ˆ๋จ

    • det = 5 : ๋ถ€ํ”ผ 5๋ฐฐ ํ™•์žฅ, ๋ฐฉํ–ฅ ๋ณด์กด

์ •๋ถ€ํ˜ธ ํ–‰๋ ฌ

  • ์–‘์˜ ์ •๋ถ€ํ˜ธ ํ–‰๋ ฌ : 0์ด ์•„๋‹Œ ๋ชจ๋“  ๋ฒกํ„ฐ x์— ๋Œ€ํ•ด xTAx>0 x^TAx > 0 xTAx>0

  • ๊ณ ์œ ๊ฐ’์€ ๋ชจ๋‘ ์–‘์ˆ˜์ด๋‹ค

  • ์—ญํ–‰๋ ฌ๋„ ์ •๋ถ€ํ˜ธ ํ–‰๋ ฌ

  • ์–‘์˜ ์ •๋ถ€ํ˜ธ, ์Œ์˜ ์ •๋ถ€ํ˜ธ๋กœ ๋‚˜๋‰˜๋ฉฐ 0์„ ํฌํ•จํ•˜๋ƒ์— ๋”ฐ๋ผ ์ค€์ •๋ถ€ํ˜ธ๋ผ๊ณ  ํ•œ๋‹ค

๋ถ„ํ•ด

  • 3717 = 3 * 3 * 7 * 59

  • ํ–‰๋ ฌ๋„ ๋ถ„ํ•ดํ•˜๋ฉด ์œ ์šฉํ•˜๋‹ค

๊ณ ์œณ๊ฐ’๊ณผ ๊ณ ์œ ๋ฒกํ„ฐ

  • Av=ฮปv Av = \lambda v Av=ฮปv

  • A๋ผ๋Š” ํ–‰๋ ฌ์— ์˜ํ•ด์„œ ์•„๋ž˜์™€ ๊ฐ™์ด ๋ฐ”๋€” ๋•Œ ์ž์„ธํžˆ ๋ณด๋ฉด ๊ณ ์œ ๋ฒกํ„ฐ์˜ ํฌ๊ธฐ๊ฐ€ ๋ฐ”๋€Œ์—ˆ์„ ๋ฟ์ด์ง€ ๋ฐฉํ–ฅ์ด ๋ฐ”๋€Œ์ง€ ์•Š๋Š”๋‹ค. ๋”ฐ๋ผ์„œ ์œ„์™€ ๊ฐ™์€ ์‹์œผ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๋œป

๊ณ ์œ  ๋ถ„ํ•ด

  • A=QAโ€ฒQโˆ’1 A = Q A'Q^{-1}A=QAโ€ฒQโˆ’1

  • Q๋Š” A์˜ ๊ณ ์œ  ๋ฒกํ„ฐ๋ฅผ ์—ด์— ๋ฐฐ์น˜ํ•œ ํ–‰๋ ฌ์ด๊ณ  A' ์€ ๊ณ ์œณ๊ฐ’์„ ๋Œ€๊ฐ์„ ์— ๋ฐฐ์น˜ํ•œ ๋Œ€๊ฐํ–‰๋ ฌ์ด๋‹ค.

  • ๊ณ ์œ  ๋ถ„ํ•ด๋Š” ๊ณ ์œ ๊ฐ’๊ณผ ํ•ด๋‹น ๊ณ ์œ  ๋ฒกํ„ฐ๊ฐ€ ์กด์žฌํ•˜๋Š” ์ •์‚ฌ๊ฐํ–‰๋ ฌ์—๋งŒ ์ ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค

  • ๊ธฐ๊ณ„ํ•™์Šต์—์„œ๋Š” ์ •์‚ฌ๊ฐํ–‰๋ ฌ์ด ์•„๋‹Œ ๊ฒฝ์šฐ์˜ ๋ถ„ํ•ด๋„ ํ•„์š”ํ•˜๋ฏ€๋กœ ํ•œ๊ณ„์ ์ด ์žˆ๋‹ค

ํŠน์ž‡๊ฐ’ ๋ถ„ํ•ด

  • ์ •์‚ฌ๊ฐํ–‰๋ ฌ์ด ์•„๋‹Œ ํ–‰๋ ฌ์„ ๋ถ„ํ•ดํ•  ๋•Œ ์‚ฌ์šฉ

ํŠน์ž‡๊ฐ’ ๋ถ„ํ•ด์˜ ๊ธฐํ•˜ํ•™์  ํ•ด์„

Deep Learning: ์‹ ๊ฒฝ๋ง์˜ ๊ธฐ์ดˆ - ๊ธฐ๊ณ„ํ•™์Šต๊ณผ ์ˆ˜ํ•™ II

ํ™•๋ฅ ๊ณผ ํ†ต๊ณ„

  • ๊ธฐ๊ณ„ ํ•™์Šต์€ ๋ถˆํ™•์‹ค์„ฑ์„ ๋‹ค๋ฃจ๋Š” ํ™•๋ฅ ๊ณผ ํ†ต๊ณ„๋ฅผ ์ด์šฉํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•ด์•ผํ•œ๋‹ค.

  • ํ•จ์ˆ˜๊ฐ€ ์•„๋‹Œ ๋ถ„๋ฐฐ๋ฅผ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ์‚ฌ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ

ํ™•๋ฅ  ๋ถ„ํฌ

  • ํ™•๋ฅ  ์งˆ๋Ÿ‰ ํ•จ์ˆ˜ : ์ด์‚ฐ ํ™•๋ฅ  ๋ณ€์ˆ˜

    • ex) ์œท๋†€์ด์—์„œ ๋‚˜์˜ฌ ์ˆ˜ ์žˆ๋Š” ๋„๊ฐœ๊ฑธ์œท๋ชจ ํ™•๋ฅ 

  • ํ™•๋ฅ  ๋ฐ€๋„ ํ•จ์ˆ˜ : ์—ฐ์† ํ™•๋ฅ  ๋ณ€์ˆ˜

ํ™•๋ฅ  ๋ฒกํ„ฐ

  • ํ™•๋ฅ ๋ณ€์ˆ˜๋ฅผ ์š”์†Œ๋กœ ๊ฐ€์ง

  • Iris์—์„œ x๋Š” 4์ฐจ์› ํ™•๋ฅ  ๋ฒกํ„ฐ์ด๋‹ค.

    • x = (x1,x2,x3,x4)T (x_1, x_2, x_3, x_4)^T(x1โ€‹,x2โ€‹,x3โ€‹,x4โ€‹)T

๋ฒ ์ด์ฆˆ ์ •๋ฆฌ

๋ฒ ์ด์ฆˆ ์ •๋ฆฌ์˜ ํ•ด์„

  • ์‚ฌํ›„ ํ™•๋ฅ  = ์šฐ๋„ ํ™•๋ฅ  * ์‚ฌ์ „ ํ™•๋ฅ 

  • ๊ธฐ๊ณ„ํ•™์Šต์—์„œ๋Š” ์‚ฌํ›„ ํ™•๋ฅ ์— ๊ด€์‹ฌ์ด ๋†’๋‹ค.

๊ธฐ๊ณ„ํ•™์Šต์— ์ ์šฉ

  • ์•„์ด๋ฆฌ์Šค ๋ฐ์ดํ„ฐ ๋ถ„๋ฅ˜ ๋ฌธ์ œ

    • ํŠน์ง• ๋ฒกํ„ฐ x๋ฅผ ํ†ตํ•ด ๋ถ„๋ฅ˜ํ•œ๋‹ค.

    • ๊ฝƒ์ด versicolor์ผ ๋•Œ ์ด ๊ฝƒ์˜ ํŠน์ง•์€ x ์ด๋‹ค => ์•Œ๊ธฐ ์‰ฌ์›€

    • ์ด ๊ฝƒ์˜ ํŠน์ง•์ด x์ผ๋•Œ ์ด ๊ฝƒ์€ versicolor ์ด๋‹ค => ์•Œ๊ธฐ ์–ด๋ ค์›€

    • ์ด๊ฒƒ์„ ๋ฒ ์ด์ฆˆ ์ •๋ฆฌ๋ฅผ ์ด์šฉํ•˜์—ฌ ๊ตฌํ•œ๋‹ค

์ตœ๋Œ€ ์šฐ๋„

  • Maximum Likelihood

  • ์–ด๋–ค ํ™•๋ฅ ๋ณ€์ˆ˜์˜ ๊ด€์ฐฐ๋œ ๊ฐ’๋“ค์„ ํ† ๋Œ€๋กœ ๊ทธ ํ™•๋ฅ ๋ณ€์ˆ˜์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•

  • ์ด ๋•Œ ์šฐ๋„๊ฐ’์ด ์ตœ๋Œ€๊ฐ€ ๋˜๋Š” ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์•„๋Š”๊ฒƒ์ด ๋ชฉํ‘œ

    • ๋”ฐ๋ผ์„œ, ์ตœ๋Œ€์šฐ๋„๊ฐ’์„ ์•Œ๊ณ ์‹ถ์€ ๊ฒƒ์ด ์•„๋‹ˆ๋‹ค

    • ์ตœ๋Œ€์šฐ๋„๊ฐ’์€ ํ™•๋ฅ ์˜ ๊ณฑ์œผ๋กœ ๋„์ถœ๋˜๋Š”๋ฐ ์ด๋ฅผ ๊ฐ„๋‹จํ•˜๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด ๋กœ๊ทธ๋ฅผ ๋Œ€์ž…

    • ๋กœ๊ทธ๋ฅผ ๋Œ€์ž…ํ•ด๋„ ์ตœ๋Œ€๊ฐ’์˜ ์œ„์น˜๋Š” ๋ณ€ํ•˜์ง€ ์•Š์œผ๋ฏ€๋กœ ์ด ๋•Œ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๋„์ถœ

๋ฐ์ดํ„ฐ์˜ ์š”์•ฝ ์ •๋ณด

  • ํ‰๊ท  => ํ‰๊ท  ๋ฒกํ„ฐ

  • ๋ถ„์‚ฐ => ๊ณต๋ถ„์‚ฐ ํ–‰๋ ฌ

๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ

๋‹ค์ฐจ์› ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ

๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ

์ดํ•ญ ๋ถ„ํฌ

  • ๋ฒ ๋ฅด๋ˆ„์ด ์‹œํ–‰์„ n๋ฒˆ ํ•œ ๊ฒƒ

๋กœ์ง€์Šคํ‹ฑ ์‹œ๊ทธ๋ชจ์ด๋“œ

  • ์ผ๋ฐ˜์ ์œผ๋กœ ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์กฐ์ •ํ•˜์—ฌ ์–ป์–ด์ง„๋‹ค

  • 0๋ถ€ํ„ฐ 1์˜ ๊ฐ’์œผ๋กœ ๋ณ€ํ™˜ํ•ด์ฃผ๋Š” ๋น„์„ ํ˜• ํ•จ์ˆ˜

์†Œํ”„ํŠธํ”Œ๋Ÿฌ์Šค ํ•จ์ˆ˜

  • 0๋ถ€ํ„ฐ์˜ ๊ฐ’์œผ๋กœ ๋ณ€ํ™˜ํ•ด์ฃผ๋Š” ๋น„์„ ํ˜• ํ•จ์ˆ˜

๊ทธ ์™ธ์˜ ๋ถ„ํฌ

  • ์ง€์ˆ˜ ๋ถ„ํฌ

  • ๋ผํ”Œ๋ผ์Šค ๋ถ„ํฌ

  • ๋””๋ž™ ๋ถ„ํฌ

  • ํ˜ผํ•ฉ ๋ถ„ํฌ

๋ณ€์ˆ˜ ๋ณ€ํ™˜

  • ๊ธฐ์กด ํ™•๋ฅ ๋ณ€์ˆ˜๋ฅผ ์ƒˆ๋กœ์šด ํ™•๋ฅ  ๋ณ€์ˆ˜๋กœ ๋ฐ”๊พธ๋Š” ๊ฒƒ

Deep Learning: ์‹ ๊ฒฝ๋ง์˜ ๊ธฐ์ดˆ - ๊ธฐ๊ณ„ํ•™์Šต๊ณผ ์ˆ˜ํ•™ III

์ •๋ณด์ด๋ก 

  • ์‚ฌ๊ฑด์ด ์ง€๋‹Œ ์ •๋ณด๋ฅผ ์ •๋Ÿ‰ํ™” ํ•  ์ˆ˜ ์žˆ๋‚˜?

    • "์•„์นจ์— ํ•ด๊ฐ€ ๋œฌ๋‹ค" ์™€ "์˜ค๋Š˜ ์•„์นจ์— ์ผ์‹์ด ์žˆ์—ˆ๋‹ค" ๋ผ๋Š” ๋‘ ์‚ฌ๊ฑด ์ค‘ ํ›„์ž์˜ ๊ฒฝ์šฐ๊ฐ€ ๋“œ๋ฌผ๊ฒŒ ๋ฐœ์ƒํ•˜๋ฏ€๋กœ ์ •๋ณด๊ฐ€ ๋” ๋งŽ์„ ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ๋‹ค. ์ „์ž๋Š” ํ”ํ•œ ์ผ๋กœ ์ด๋ฃจ์–ด์ง€๊ธฐ ๋•Œ๋ฌธ

  • ๊ธฐ๋ณธ์›๋ฆฌ : ํ™•๋ฅ ์ด ์ž‘์„์ˆ˜๋ก ๋งŽ์€ ์ •๋ณด๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค

    • ์ž˜ ์ผ์–ด๋‚˜์ง€ ์•Š์€ ์‚ฌ๊ฑด์˜ ์ •๋ณด๋Ÿ‰์ด ๋งŽ๋‹ค

์ž๊ธฐ ์ •๋ณด

  • ์‚ฌ๊ฑด(๋ฉ”์‹œ์ง€) ei e_ieiโ€‹์˜ ์ •๋ณด๋Ÿ‰

    • ๋‹จ์œ„

      • ๋กœ๊ทธ์˜ ๋ฐ‘์ด 2์ธ ๊ฒฝ์šฐ : ๋น„ํŠธ

      • ๋กœ๊ทธ์˜ ๋ฐ‘์ด ์ž์—ฐ์ƒ์ˆ˜์ธ ๊ฒฝ์šฐ : ๋‚˜์ธ 

    • ์ฃผ๋กœ ๋น„ํŠธ๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค

  • h(ei)=โˆ’log2P(ei)ย orย h(ei)=โˆ’logeP(ei) h(e_i) = -log_2P(e_i)~or~ h(e_i) = -log_eP(e_i)h(eiโ€‹)=โˆ’log2โ€‹P(eiโ€‹)ย orย h(eiโ€‹)=โˆ’logeโ€‹P(eiโ€‹)

    • ๋™์ „์—์„œ ์•ž๋ฉด์ด ๋‚˜์˜ค๋Š” ์‚ฌ๊ฑด์˜ ์ •๋ณด๋Ÿ‰์€ โˆ’log2(1/2)=1 -log_2(1/2) = 1โˆ’log2โ€‹(1/2)=1์ด๋‹ค.

    • ์ฃผ์‚ฌ์œ„์—์„œ 1์ด ๋‚˜์˜ค๋Š” ์‚ฌ๊ฑด์˜ ์ •๋ณด๋Ÿ‰์€ โˆ’log2(1/6)โ‰ˆ2.58 -log2(1/6) \approx 2.58 โˆ’log2(1/6)โ‰ˆ2.58์ด๋‹ค.

    • ์ฃผ์‚ฌ์œ„์˜ ์‚ฌ๊ฑด์ด ๋™์ „์˜ ์‚ฌ๊ฑด๋ณด๋‹ค ๋†’์€ ์ •๋ณด๋Ÿ‰์„ ๊ฐ€์ง

์—”ํŠธ๋กœํ”ผ

  • ํ™•๋ฅ ๋ณ€์ˆ˜ x์˜ ๋ถˆํ™•์‹ค์„ฑ์„ ๋‚˜ํƒ€๋‚ด๋Š” ์—”ํŠธ๋กœํ”ผ

  • ๋ชจ๋“  ์‚ฌ๊ฑด ์ •๋ณด๋Ÿ‰์˜ ๊ธฐ๋Œ€๊ฐ’์œผ๋กœ ํ‘œํ˜„

  • ๋‘ ํ™•๋ฅ ๊ฐ„์˜ ์œ ์‚ฌ๋„๋ฅผ ์ธก์ •ํ•  ๋•Œ ์‚ฌ์šฉํ•œ๋‹ค

  • ๋ถˆํ™•์‹ค์„ฑ์ด ๊ฐ€์žฅ ํด ๋•Œ(์ฆ‰ ์ด ๋ง์€ ํ™•๋ฅ ์ด ๊ณต์ •ํ•˜๋‹ค๋Š” ๋œป) ์—”ํŠธ๋กœํ”ผ๊ฐ€ ๊ฐ€์žฅ ํฌ๋‹ค

  • ์—”ํŠธ๋กœํ”ผ ์˜ˆ

    • ์œท์„ ๋‚˜ํƒ€๋‚ด๋Š” ์œท๋†€์ด์˜ ํ™•๋ฅ ๋ณ€์ˆ˜๋Š” 2.0306๋น„ํŠธ

    • 6์„ ๋‚˜ํƒ€๋‚ด๋Š” ์ฃผ์‚ฌ์œ„์˜ ํ™•๋ฅ ๋ณ€์ˆ˜๋Š” 2.585

    • ์ฃผ์‚ฌ์œ„๊ฐ€ ์œท๋ณด๋‹ค ์—”ํŠธ๋กœํ”ผ๊ฐ€ ๋†’์€ ์ด์œ ?

      • ์ฃผ์‚ฌ์œ„๋Š” ๋ชจ๋“  ์‚ฌ๊ฑด์ด ๋™์ผํ•œ ํ™•๋ฅ 

      • ์œท๋ณด๋‹ค ์˜ˆ์ธกํ•˜๊ธฐ ์–ด๋ ค์›€

      • ์ฃผ์‚ฌ์œ„๊ฐ€ ์œท๋ณด๋‹ค ๋” ๋ฌด์งˆ์„œํ•˜๊ณ  ๋ถˆํ™•์‹ค์„ฑ์ด ํผ

      • ์—”ํŠธ๋กœํ”ผ๊ฐ€ ๋†’์Œ

๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ

  • ์—”ํŠธ๋กœํ”ผ : ํ™•๋ฅ ์„ ์ •๋Ÿ‰ํ™” ํ•œ ๊ฒƒ

  • ๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ : ๋‘ ๊ฐœ์˜ ํ™•๋ฅ ์˜ ์œ ์‚ฌ๋„ => ๋™์ผํ•œ ์ •๋ณด๋ฅผ ์–ผ๋งˆ๋‚˜ ๊ณต์œ ํ•˜๋Š” ์ง€

  • ์›๋ž˜ ์—”ํŠธ๋กœํ”ผ ์‹์—์„œ ๋ฐ”๊นฅ P(x)๊ฐ€ ๋ฐ”๋€ ๊ฒƒ.

  • ์‹ฌ์ธตํ•™์Šต์ด ์†์‹คํ•จ์ˆ˜๋กœ ๋งŽ์ด ์‚ฌ์šฉ๋œ๋‹ค.

  • ์ด ์‹์„ ์ „๊ฐœํ•˜๋ฉด,

  • Q : ์˜ˆ์ธก๊ฐ’, P : ๋ฐ์ดํ„ฐ ๋ถ„ํฌ

  • P๊ฐ’์€ ๊ณ ์ •์ด๊ณ  Q๊ฐ’์„ ๋ณ€ํ™”์‹œํ‚ค๋Š” ์ž‘์—…

  • ๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ๋ฅผ ์†์‹คํ•จ์ˆ˜๋กœ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ๋Š” P๊ฐ’์€ ๋ณ€ํ™”ํ•˜์ง€ ์•Š์œผ๋ฏ€๋กœ KL ๋ฐœ์‚ฐ์„ ์ตœ์†Œํ•˜ ํ•˜๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ

KL ๋‹ค์ด๋ฒ„์ „์Šค

  • P์™€ Q๋Š” ๋‘˜ ๋‹ค ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์ด๋ฉฐ ์„œ๋กœ์˜ ๋ถ„ํฌ๋ฅผ ์กฐ์ž‘ํ•ด์„œ ์œ ์‚ฌํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ

  • KL Area๋Š” ๋‘ ๊ฐ’์˜ ์ฐจ์ด๋‚˜๋Š” ๋ฉด์ ์„ ๊ทธ๋ฆฌ๊ณ  ์žˆ์Œ => ์ด ๋ฉด์ ์„ ์ตœ์†Œํ™” ํ•˜๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ

  • ๋‘ ํ™•๋ฅ ๋ถ„ํฌ ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ„์‚ฐํ•  ๋•Œ ์ฃผ๋กœ ์‚ฌ์šฉํ•œ๋‹ค

  • ์ด๋Š” P์˜ ์—”ํŠธ๋กœํ”ผ + P์™€ Q๊ฐ„์˜ KL ๋‹ค์ด๋ฒ„์ „์Šค๋ฅผ ๋”ํ•œ๊ฒƒ์ด๋‹ค.

  • ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๋ฐ์ดํ„ฐ ๋ถ„ํฌ P(x)์™€ ์ถ”์ •ํ•œ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ Q(x)๊ฐ„์˜ ์ฐจ์ด๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š”๋ฐ ๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค.

๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ ์ ์šฉ ์˜ˆ

  • ๋ชจ๋ธ์„ ํ†ตํ•ด 5๊ฐ€์ง€์˜ ์ž…๋ ฅ๊ฐ’์„ ์ž…๋ ฅ

  • ์ด ๋•Œ softmax value๋กœ ์–ป์€ ํ™•๋ฅ ๋ถ„ํฌ์™€ ์‹ค์ œ ๋ผ๋ฒจ(๊ทน๋‹จ์ ์ธ ํ™•๋ฅ ๋ถ„ํฌ)์„ ๋น„๊ตํ•  ๋•Œ ์‚ฌ์šฉํ•œ๋‹ค.

์ตœ์ ํ™”

  • ์ˆœ์ˆ˜ ์ˆ˜ํ•™ ์ตœ์ ํ™”

    • ์ฃผ์–ด์ง€๋Š” ๋ชฉ์ ํ•จ์ˆ˜์˜ ์ตœ์ €์ ์„ ์ฐพ์•„์•ผ ํ•œ๋‹ค

  • ๊ธฐ๊ณ„ ํ•™์Šต ์ตœ์ ํ™”

    • ํ›ˆ๋ จ์ง‘ํ•ฉ์ด ์ฃผ์–ด์ง€๊ณ  ์ด์— ๋”ฐ๋ผ ์ •ํ•ด์ง€๋Š” ๋ชฉ์ ํ•จ์ˆ˜๋ฅผ ์ตœ์†Œ๋กœ ๋งŒ๋“ค์–ด๋‚ด๋Š” ๋ชจ๋ธ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์ฐพ์•„์•ผ ํ•œ๋‹ค

    • ์ฃผ๋กœ SGD(ํ™•๋ฅ ๋ก ์  ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ•)๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค

    • ์†์‹คํ•จ์ˆ˜๋Š” ๋ฏธ๋ถ„ํ•˜๋Š” ๊ณผ์ •์ด ํ•„์š” ํ•˜๋‹ค => ์˜ค๋ฅ˜ ์—ญ์ „ํŒŒ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์‚ฌ์šฉ

๋งค๊ฐœ๋ณ€์ˆ˜ ๊ณต๊ฐ„ ํƒ์ƒ‰

  • ํ›ˆ๋ จ์ง‘ํ•ฉ์˜ ํฌ๊ธฐ๊ฐ€ ์ž‘๊ธฐ ๋•Œ๋ฌธ์— ๋ฐ์ดํ„ฐ์˜ ํŠน์ง• ๊ณต๊ฐ„์„ ๋ชจ๋‘ ๋งŒ์กฑ์‹œํ‚ค๋Š” ํ™•๋ฅ ๋ถ„ํฌ๋ฅผ ๊ตฌํ• ์ˆ˜๋Š” ์—†๋‹ค.

  • ํŠน์ง• ๊ณต๊ฐ„์— ๋Œ€ํ•ด ์„ค์ •ํ•œ ๊ฐ€์„ค๊ณผ ๋ชฉ์ ํ•จ์ˆ˜๋ฅผ ์„ ํƒํ•˜๊ณ  ์ด ๋ชฉ์ ํ•จ์ˆ˜๊ฐ€ ์ตœ์ €๊ฐ€ ๋˜๋„๋ก ํ•˜๋Š” ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ํƒ์ƒ‰ํ•˜๋Š” ์ „๋žต์„ ์‚ฌ์šฉํ•œ๋‹ค

ํ•™์Šต ๋ชจ๋ธ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜ ๊ณต๊ฐ„

  • ํŠน์ง• ๊ณต๊ฐ„๋ณด๋‹ค ์ˆ˜๋งŒ๋ฐฐ ๋งŽ์€ ์ฐจ์›์„ ๊ฐ€์ง

    • MNIST ์ธ์‹ํ•˜๋Š” ์‹ฌ์ธตํ•™์Šต ๋ชจ๋ธ์€ 784์ฐจ์› ํŠน์ง• ๊ณต๊ฐ„

    • ๋งค๊ฐœ๋ณ€์ˆ˜ ๊ณต๊ฐ„์€ ์ˆ˜์‹ญ๋งŒ~์ˆ˜๋ฐฑ๋งŒ ์ฐจ์›์˜ ๋งค๊ฐœ๋ณ€์ˆ˜ ๊ณต๊ฐ„

    • ์‹ค์ œ๋กœ ๋งค๊ฐœ๋ณ€์ˆ˜ ๊ณต๊ฐ„, ์†์‹ค ํ•จ์ˆ˜๋Š” ๊ตฌํ•˜๊ธฐ๊ฐ€ ์–ด๋ ต๋‹ค.

    • ์ด ๋•Œ์˜ ๋ฏธ๋ถ„๊ฐ’์„ ๊ตฌํ•ด์„œ ์ตœ์ ํ•ด๋ฅผ ์ฐพ์œผ๋ ค๊ณ  ํ•จ

์ตœ์ ํ™” ๋ฌธ์ œ ํ•ด๊ฒฐ

  • ๋‚ฑ๋‚ฑํƒ์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜

    • ์ฐจ์›์ด ์กฐ๊ธˆ๋งŒ ๋†’์•„์ ธ๋„ ์ ์šฉ ๋ถˆ๊ฐ€๋Šฅ

  • ๋ฌด์ž‘์œ„ ํƒ์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜

    • ์•„๋ฌด๋Ÿฐ ์ „๋žต์ด ์—†์Œ

  • ์ดˆ๊ธฐํ•ด theta๋ฅผ ์„ค์ •ํ•˜๊ณ  ์ž‘์•„์ง€๋Š” ๋ฐฉํ–ฅ d(theta)๋ฅผ ๊ตฌํ•œ๋‹ค.

    • ๋ฏธ๋ถ„์œผ๋กœ ์ฐพ์•„๋‚ธ๋‹ค.

๋ฏธ๋ถ„์— ์˜ํ•œ ์ตœ์ ํ™”

  • ๋„ํ•จ์ˆ˜๋Š” ํ•จ์ˆ˜์˜ ๊ธฐ์šธ๊ธฐ๋ฅผ ์˜๋ฏธ => ํ•จ์ˆ˜์˜ ๊ฐ’์ด ์ปค์ง€๊ณ  ์ž‘์•„์ง€๋Š” ๋ฐฉํ–ฅ์„ ์•Œ ์ˆ˜ ์žˆ์Œ

  • ์ด๊ณ„๋„ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ด ๊ทน์†Œ, ๊ทน๋Œ€๊ฐ’์„ ์ฐพ์„ ์ˆ˜๋„ ์žˆ๋‹ค

ํŽธ๋ฏธ๋ถ„

  • ๋ณ€์ˆ˜๊ฐ€ ๋ณต์ˆ˜์ธ ํ•จ์ˆ˜์˜ ๋ฏธ๋ถ„

  • ๋ฏธ๋ถ„ ๊ฐ’์ด ์ด๋ฃจ๋Š” ๋ฒกํ„ฐ๋ฅผ ๊ฒฝ์‚ฌ๋„๋ผ๊ณ  ๋ถ€๋ฆ„ = gradient

  • ๊ธฐ๊ณ„ํ•™์Šต์—์„œ ๋งค๊ฐœ๋ณ€์ˆ˜ ์ง‘ํ•ฉ์€ ๋ณต์ˆ˜์ด๋ฏ€๋กœ ํŽธ๋ฏธ๋ถ„์„ ์‚ฌ์šฉํ•œ๋‹ค

๋…๋ฆฝ๋ณ€์ˆ˜์™€ ์ข…์†๋ณ€์ˆ˜์˜ ๊ตฌ๋ถ„

y = wx + b

  • x๋Š” ๋…๋ฆฝ๋ณ€์ˆ˜, y๋Š” ์ข…์†๋ณ€์ˆ˜

  • ๊ธฐ๊ณ„ํ•™์Šต์—์„œ ์˜ˆ์ธก ๋‹จ๊ณ„๋ฅผ ์œ„ํ•œ ํ•ด์„์€ ๋ฌด์˜๋ฏธํ•จ

  • ์ตœ์ ํ™”๋Š” ์˜ˆ์ธก ๋‹จ๊ณ„๊ฐ€ ์•„๋‹ˆ๋ผ ํ•™์Šต ๋‹จ๊ณ„์— ํ•„์š”

์•ผ์ฝ”๋น„์–ธ ํ–‰๋ ฌ

  • 1์ฐจ ํŽธ๋„ ๋ฏธ๋ถ„ํ•œ ํ–‰๋ ฌ

ํ•ด์„ธ ํ–‰๋ ฌ

  • 2์ฐจ ํŽธ๋„ ๋ฏธ๋ถ„ํ•œ ํ–‰๋ ฌ

๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•

  • ๋‚ฎ์€ ๊ณณ์„ ์ฐพ์•„๊ฐ€๋Š” ์›๋ฆฌ

  • ์ด๋™ ๋ฐฉํ–ฅ์€ ๊ธฐ์šธ๊ธฐ์ด๊ณ , ์ด๋™ ๊ฑฐ๋ฆฌ๋Š” ํ•™์Šต๋ฅ ์ด๋‹ค.

์ง‘๋‹จ(๋ฌด๋ฆฌ) ๊ฒฝ์‚ฌ ํ•˜๊ฐ• ์•Œ๊ณ ๋ฆฌ์ฆ˜

  • BGD : Batch Gradient Descent

  • ์ƒ˜ํ”Œ์˜ ๊ฒฝ์‚ฌ๋„๋ฅผ ๊ตฌํ•˜๊ณ  ํ‰๊ท ํ•œ ํ›„ ํ•œ๊บผ๋ฒˆ์— ๊ฐฑ์‹ 

  • ํ›ˆ๋ จ์ง‘ํ•ฉ ์ „์ฒด๋ฅผ ๋‹ค ๋ด์•ผ ๊ฐฑ์‹ ์ด ์ผ์–ด๋‚˜๋ฏ€๋กœ ํ•™์Šต ๊ณผ์ •์ด ์˜ค๋ž˜ ๊ฑธ๋ฆฌ๋Š” ๋‹จ์ 

  • ์ •ํ™•ํ•œ ๋ฐฉํ–ฅ์œผ๋กœ ์ˆ˜๋ ด

ํ™•๋ฅ ๋ก ์  ๊ฒฝ์‚ฌ ํ•˜๊ฐ• ์•Œ๊ณ ๋ฆฌ์ฆ˜

  • SGD : Sthchastic gradient descent

  • ํ•œ ์ƒ˜ํ”Œ ํ˜น์€ ์ž‘์€ ์ง‘๋‹จ์˜ ๊ฒฝ์‚ฌ๋„๋ฅผ ๊ณ„์‚ฐํ•œ ํ›„ ์ฆ‰์‹œ ๊ฐฑ์‹ 

  • ์ž‘์€ ๋ฌด๋ฆฌ ๋‹จ์œ„๋ฅผ ํ•œ ์„ธ๋Œ€ Epoch๋ผ๊ณ  ๋ถ€๋ฆ„

  • ์ˆ˜๋ ด์ด ๋‹ค์†Œ ํ—ค๋งฌ ์ˆ˜ ์žˆ์Œ.

์ถ”๊ฐ€ ๊ฒฝ์‚ฌ ํ•˜๊ฐ• ์•Œ๊ณ ๋ฆฌ์ฆ˜๋“ค

  • Momentum

  • NAG

  • Adagrad

  • Adadelta

  • Rmsprop

Deep Learning: ์‹ ๊ฒฝ๋ง์˜ ๊ธฐ์ดˆ - ์‹ค์Šต I

CPU vs GPU

  • CPU

    • ์ฝ”์–ด์ˆ˜๊ฐ€ ์ ๊ณ  ๊ฐ๊ฐ์˜ ์ฝ”์–ด๊ฐ€ ๋” ๋น ๋ฅด๋‹ค ์—ฐ์‚ฐ๋ ฅ์ด ์šฐ์›”

    • ์—ฐ์†์ ์ธ ์ž‘์—…์— ์šฐ์›”

  • GPU

    • ์ฝ”์–ด์ˆ˜๊ฐ€ ๋งŽ๊ณ  ๊ฐ๊ฐ์˜ ์ฝ”์–ด๊ฐ€ ์ข€ ๋‘”ํ•˜๋‹ค

    • ๋ณ‘๋ ฌ์ ์ธ ์ž‘์—…์— ์šฐ์›”

GPU

  • ํ–‰๋ ฌ์˜ ์—ฐ์‚ฐ์— ์žˆ์–ด GPU๊ฐ€ ์œ ๋ฆฌ

  • GigaFLOPs per Dollor

    • GigaFLOPs๋Š” ์—ฐ์‚ฐ๋ ฅ์˜ ๋‹จ์œ„

  • Deep Learning Explosion : ์ด ๋•Œ ๋”ฅ๋Ÿฌ๋‹์ด ๊ฐ€์žฅ ๋ฐœ์ „ํ–ˆ๋‹ค

  • ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•  ๋•Œ CPU ๋ณด๋‹ค GPU ์„ฑ๋Šฅ์ด 64๋ฐฐ์—์„œ 76๋ฐฐ๊นŒ์ง€ ๋‚œ๋‹ค.

    • ๊ณต์ •ํ•œ ๋น„๊ต๋Š” ์•„๋‹ ์ˆ˜ ์žˆ์ง€๋งŒ ๊ทธ๊ฒƒ์„ ๊ฐ์•ˆํ•ด๋„ ์—„์ฒญ๋‚œ ์ฐจ์ด

    • ์™„์ „ ์ตœ์ ํ™” ๋˜์ง€ ์•Š์•˜์„ ๋•Œ๋Š” 3๋ฐฐ ์ •๋„ ์ฐจ์ด๊ฐ€ ๋‚œ๋‹ค

TPU

  • ๊ตฌ๊ธ€์—์„œ ์‚ฌ์šฉํ•˜๋Š” ์šฉ์–ด

  • ๋”ฅ๋Ÿฌ๋‹ ์—ฐ์‚ฐ์— ํšจ์œจ์ ์œผ๋กœ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ๋„๋ก ์„ค๊ณ„๋˜์–ด ์žˆ๋Š” ์•„ํ‚คํ…์ฒ˜

Programming GPUs

  • CUDA

    • NVIDIA์—์„œ๋งŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Œ

    • GPU ์—ฐ์‚ฐ์— ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Œ

  • OPENCL

    • ์–ด๋А ์žฅ์น˜์—์„œ๋„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Œ

    • NVIDIA์—์„œ๋Š” ์กฐ๊ธˆ ๋А๋ฆผ

  • HIP

CPU / GPU Communication

  • ์—ฐ์‚ฐ์€ GPU, ๋ฐ์ดํ„ฐ๋Š” DISK

  • ๋‘˜ ์‚ฌ์ด์˜ ํ†ต์‹ ์ด ๋А๋ฆฌ๋ฉด ๋ณ‘๋ชฉํ˜„์ƒ ๋ฐœ์ƒ

  • ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ฐœ์„ ์ ์ด ์žˆ๋‹ค

    • RAM์„ ๋” ์‚ฌ์šฉ

    • HDD๋Œ€์‹  SSD

    • CPU ์“ฐ๋ ˆ๋“œ๋ฅผ ๋” ๋งŽ์ด ์‚ฌ์šฉํ•ด์„œ ๋ฏธ๋ฆฌ ๋ฐ์ดํ„ฐ fetch

Deeplearning Framework

  • ๋น ๋ฅด๊ฒŒ ๊ฐœ๋ฐœํ•  ์ˆ˜ ์žˆ์Œ

  • ๊ธฐ์šธ๊ธฐ๋ฅผ ์ž๋™์œผ๋กœ ๊ฐœ์‚ฐ

  • ๋ชจ๋“  ์—ฐ์‚ฐ๋“ค์ด GPU์—์„œ ๊ณ„์‚ฐ๋  ์ˆ˜ ์žˆ๋‹ค

PyTorch : Fundamental Concepts

  • Tensor

    • Numpy์™€ ๋น„์Šท

    • GPU ์—์„œ ์—ฐ์‚ฐ ๊ฐ€๋Šฅ

  • Autograd

    • ์ง์ ‘ ๊ธฐ์šธ๊ธฐ๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ๋ฐฑ์›Œ๋“œ๋กœ ๊ตฌํ•ด์ง„๋‹ค

    • ํฌ์›Œ๋“œ๋กœ ๊ณ„์‚ฐํ•  ๋•Œ ์ค‘๊ฐ„ ์—ฐ์‚ฐ์„ ์ €์žฅํ•  ํ•„์š” ์—†๊ณ  ์ˆ˜๋™์œผ๋กœ ํ•  ํ•„์š”๋„ ์—†๋‹ค

  • Module

Previous20 WedNext18 Mon

Last updated 4 years ago

Was this helpful?

๋†ˆ์˜ ์ •์˜๊ฐ€ ์• ๋งคํ•˜๋‹ค๋ฉด? =>

(๋งํฌ)