최근, 머신러닝에 대해서 이것저것 서칭을 하다가 MLOps에 관한 키워드가 많이 보여서 한번 알아보았다.
한 프로젝트 안에서 코드를 짜서 머신러닝을 돌려서 테스트를 해보는 것은 물론 중요한 부분이다. 하지만 이것이 실제로 어떻게 실생활에서 적용이 되고, 어떤 식으로 서비스가 이루어지는지 크게 보면 사소한 부분이라고 볼 수 있다고 한다.
- MLOps는 ML + Ops를 합친 용어로 머신러닝 모델 개발과 머신러닝 운영 Workflow의 간극을 줄이기 위한 분야이다.
- 크게 Model Development와 Model Prediction으로 나누는 관점으로 볼 수 있다.
- MLOps의 목표는
- 머신러닝 모델 개발과 머신러닝 모델 운영에서 사용되는 문제의 반복을 최소화 하면서 비즈니스 가치를 창출하는 것
- 모델링에 집중할 수 있도록 안정된 인프라를 구축하고 자동으로 운영하는 것
- 빠른 시간에 적은 Risk로 Production까지 진행할 수 있도록 기술적 마찰을 줄이는 것
- MLOps의 중요한 원칙은
- Reprodcibiltiy(재현성)
- Research 단계에서 만든 모델이 production 환경에도 재현되어야 한다.
- 데이터도 유사한 분포를 가져야 한다.
- Orchestration(오케스트레이션)
- 서비스의 자동화된 설정, 관리, 조정 등
- 만약 예측하려는 요청이 많은 경우 내부적으로 서버를 증설해야 한다.
- Reprodcibiltiy(재현성)
- 데이터 직군들의 Task
- Data Scientist : 모델 개발
- Data Engineer : 데이터 파이프라인 개발
- MLOps Engineer : 모델, 데이터 파이프라인 및 Production 부분 담당
이상 간단하게 MLOps를 알아보았다. ML쪽을 연구하는 학생으로, MLOps에 대해서 더 알아볼 생각이다.
https://zzsza.github.io/mlops/2018/12/28/mlops/ 이분의 글을 많이 참고하였고, 더 깊고 많은 정보가 있는 블로그이다.
'공부 > 하루 1단어' 카테고리의 다른 글
Attention VS Self Attention (0) | 2022.01.17 |
---|---|
Zero Shot, One Shot, Few Shot Learning (0) | 2022.01.04 |
Python3 vs Pypy3 (0) | 2021.12.19 |