Tech for good

<머신러닝 파워드 애플리케이션(Building Machine Learning Powered Applications), 에마뉘엘 아메장 지음; 박해선 옮김> 본문

Book & Article

<머신러닝 파워드 애플리케이션(Building Machine Learning Powered Applications), 에마뉘엘 아메장 지음; 박해선 옮김>

Diana Kang 2022. 3. 27. 23:29

 

 

머신러닝 모델을 장착한 실용적인 애플리케이션을 만드는 방법을
쉽게 따라하며 배울 수 있는 책이다.



머신러닝 구축의 핵심인 

1. 주어진 특성에 맞는 올바른 머신러닝 방법 선택,
2. 모델의 오류와 데이터 품질 문제 분석,
3. 모델의 결과를 검증하여 제품의 품질 보장

위의 일련의 과정들을 안내하고 있다.


제품 아이디어에서 프로토타입 배포까지 전체 과정을 다루고 있기에 
코딩 경험과 머신러닝 기초 지식을 가지고 
머신러닝 기반 제품을 구축하는 방법을 배우는데 안성맞춤이다. 

 

 


 

머신러닝의 전체 과정

머신러닝 제품을 성공적으로 사용자에게 제공하려면

제품의 요구 사항을 머신러닝 문제로 표현하고, 적절한 데이터를 수집하고, 여러 모델을 효율적으로 반복하고, 결과를 검증하고, 견고한 방법으로 배포해야 한다.

 

 

1. 올바른 머신러닝 접근 방법 모색: 머신러닝 분야는 넓고 제품의 목표를 달성하기 위한 다양한 방법이 존재한다. 주어진 문제를 위한 최상의 방법은 성공 기준, 가용 데이터, 문제의 복잡성과 같은 많은 요소에 따라 달라진다. 이 단계의 목표는 올바른 성공 기준을 설정하고 적절한 초기 데이터셋과 모델을 찾는 것이다. 

 

2. 초기 프로토타입 제작: 모델링 작업을 하기 전에 먼저 엔드투엔드 프로토타입을 만든다. 이 프로토타입은 머신러닝을 사용하지 않고 제품의 목표를 달성하는 것이 목적이다. 또한 최상의 머신러닝 적용 방법을 결정하는 데 도움이 된다. 프로토타입이 구축되면 머신러닝의 필요성을 알 수 있고 모델 훈련을 위해 데이터 수집을 시작할 수 있다. 

 

3. 모델 반복: 데이터셋이 준비되면 모델을 훈련하고 단점을 평가할 수 있다. 이 단계의 목표는 오류 분석과 구현 사이를 오가며 반복하는 것이다. 이 반복 루프의 속도를 높이는 것이 머신러닝 개발 속도를 높이는 최상의 방법이다.

 

4. 배포와 모니터링: 모델이 좋은 성능을 내면 이제 배포를 할 단계이다. 배포된 후에 예상치 못한 이유로 종종 모델이 실패하는 경우가 있기 때문에 모델의 오류를 완화하고 모니터링 하는 방안을 마련하는 것 또한 아주 중요하다. 

 

 


책의 목차는 아래와 같다.

 

Part 1. 올바른 머신러닝 접근 방법 모색

Ch1. 제품의 목표를 머신러닝 문제로 표현하기

Ch2. 계획 수립하기

 

Part 2. 초기 프로토타입 제작

Ch3. 엔드투엔드 파이프라인 만들기

Ch4. 초기 데이터셋 준비하기

 

Part 3. 모델 반복

Ch5. 모델 훈련과 평가

Ch6. 머신러닝 문제 디버깅

Ch7. 분류기를 사용한 글쓰기 추천

 

Part 4. 배포와 모니터링

Ch8. 모델 배포 시 고려 사항

Ch9. 배포 방식 선택

Ch10. 모델 안전장치 만들기

Ch11. 모니터링과 모델 업데이트

 

 

이제 책의 예제를 따라가며 사용자가 글을 더 잘 쓰도록 돕는 '머신러닝 보조 글쓰기 애플리케이션' 을 구축해보자!

 

 


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."