Tech for good

<머신러닝 실무 프로젝트(Machine Learning at Work) 2판>; 김모세 옮김 본문

Book & Article

<머신러닝 실무 프로젝트(Machine Learning at Work) 2판>; 김모세 옮김

Diana Kang 2022. 4. 24. 13:57

들어가며

대량의 데이터를 쉽게 수집할 수 있고, 수집한 데이터를 처리하는 하드웨어의 성능은 좋아졌으며, 최신 알고리즘이 구현된 오픈소스 프레임워크를 손쉽게 사용할 수 있게 된 시대이다!

덕분에 머신러닝을 도입하기 위한 장벽은 한층 낮아졌다.

하지만 이를 실제 비즈니스에 적용하는 문제는 다르다. 해결해야 하는 문제를 스스로 정의하고 시스템을 설계하는 방법은 조금 더 고차원적이기 때문이다.

이 책은 머신러닝 입문서를 떼고 실무에 활용하려는 개발자, 머신러닝 시스템 및 기술적인 내용에 흥미가 있는 비즈니스 담당자 같은 독자를 대상으로 머신러닝과 데이터 분석 도구를 비즈니스에 활용하는 방법을 알려주고 있다.

조금 더 구체적으로 살펴보면 아래와 같은 사항들을 배울 수 있다.

  • 머신러닝 프로젝트를 시작하는 방법
  • 기존 시스템에 머신러닝을 통합하는 방법
  • 머신러닝에 사용할 데이터를 수집하는 방법
  • 가설을 수립하고 분석하는 방법


파이썬과 사이킷런을 사용한 코드 위주로 설명하며, 어느 정도의 수학 지식과 머신러닝 기초 지식이 요구된다.

이 책의 구성

책의 구성은 크게 1부와 2부로 나뉜다. 1부에서는 머신러닝 프로젝트를 수행하기 위해 알아야 할 지식을 다루고 있으며, 2부에서는 실제 사례 연구를 살펴볼 수 있다.

1부

  • 1장 👉 머신러닝 프로젝트가 어떤 과정을 거쳐 수행되는지 정리한다.
  • 2장 👉 머신러닝으로 할 수 있는 일과 다양한 머신러닝 알고리즘을 소개한다. 각 알고리즘의 특성을 카탈로그 형태로 정리하고 있어 알고리즘 선택 요령 및 알고리즘의 결정 경계 형태를 쉽게 확인할 수 있다.
  • 3장 👉 머신러닝 결과 평가 방법을 설명한다. 네 가지 주요 평가 지표들의 개념(정확도(accuracy), 정밀도(precision), 재현율(recall), F값(f-measure))과 해당 지표들을 고려할 때 중요한 개념들(혼동행렬(confusion matrix), 마이크로 평균(micro-average), 매크로 평균(macro-average))을 알 수 있다.
  • 4장 👉 기존 시스템에 머신러닝을 통합하는 방법과 머신러닝에 사용할 훈련 데이터를 얻기 위한 로그 수집 방법을 알아본다.
  • (5장 👉 머신러닝 분류 태스크에서의 정답 데이터를 수집하는 방법에 관해 설명한다.)
  • 6장 👉 장기적으로 운용/학습을 계속하는 지속적 학습을 위한 머신러닝 기반과 MLOps에 관해 설명한다.
  • 7장 👉 도입한 정책이 실제로 효과가 있는지 성과를 검증하는 통계 검정, 인과 효과 추론, A/B 테스트를 소개한다.
  • 8장 👉 머신러닝을 통해 얻은 예측 결과를 파악한다.

2부

  • 9장 👉 실제 데이터를 분석해보며 생각해야 할 점과 분석 결과로 만들 수 있는 보고서를 작성해본다.
  • 10장 👉 업리프트 모델링(uplift modeling)을 살펴보고 이를 활용해 더욱 효과적인 마케팅을 수행하는 방법을 알아본다.
  • 11장 👉 온라인 광고 콘텍스트에서 자주 사용되는 슬롯머신 알고리즘을 이용한 강화학습을 다룬다.
  • 12장 👉 온라인 광고를 소재로 실제 시스템에 어떤 머신러닝이 최적화되어 적용되었는지 살펴본다.



1부를 통해 머신러닝 실무 노하우를 파악하고, 2부에서는 이를 활용해 실무 프로젝트를 직접 따라해보는 경험을 해볼 수 있다.


아래의 깃허브를 통해 책에서 사용하고 있는 코드를 다운로드 할 수 있으니, 책의 내용과 코드 실습으로 차근차근 머신러닝 실무 경험치를 쌓아올려보자!


https://github.com/moseskim/ml-at-work

GitHub - moseskim/ml-at-work: 머신러닝 실무 프로젝트 (2판) 샘플 코드 저장소입니다.

머신러닝 실무 프로젝트 (2판) 샘플 코드 저장소입니다. Contribute to moseskim/ml-at-work development by creating an account on GitHub.

github.com




"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."