머신러닝에서 딥러닝으로의 전환
― 왜 AI의 흐름이 바뀌었을까?
최근 AI와 LLM(대규모 언어 모델) 강의를 들으면서 가장 인상 깊었던 부분은
머신러닝에서 딥러닝으로 넘어오게 된 배경이었습니다.
예전 방식과 지금 방식은 생각보다 큰 차이가 있습니다.
1. 전통적인 머신러닝 이전: “사람이 룰을 정해주던 시대”
머신러닝 이전의 프로그램들은 대부분 규칙 기반(rule-based) 방식이었습니다.
예를 들어 스팸메일 필터를 만든다고 하면,
- “무료”
- “대출”
- “100% 보장”
같은 스팸 키워드를 사람이 미리 정해주고,
이 키워드가 포함되면 스팸으로 분류하는 식이었습니다.
👉 문제는
- 규칙이 늘어날수록 관리가 어려워지고
- 새로운 유형의 스팸에는 바로 대응하지 못한다는 점이었습니다.
2. 머신러닝의 등장: “정답을 보고 판단을 배우다”
머신러닝은 접근 방식이 달랐습니다.
사람이 규칙을 하나하나 정해주는 대신,
- 스팸메일
- 정상메일
을 미리 분류해 놓은 데이터를 주고
“이걸 보고 스스로 판단 기준을 찾아라”
라고 학습시키는 방식입니다.
이 과정에서 머신러닝은:
- 스팸인지 정상인지 판단
- 내부적으로 **특징(feature)**을 찾아냅니다.
초기에는
- 선형 모델
- 결정 트리 같은 비교적 단순한 알고리즘이 주로 사용되었습니다.
3. 머신러닝의 한계: “데이터가 복잡해질수록 성능이 떨어진다”
문제는 데이터가 점점 복잡해지면서 발생했습니다.
- 이미지
- 음성
- 자연어(문장)
같은 데이터는
사람이 정의한 특징이나 단순한 알고리즘으로는 한계가 명확했습니다.
👉 복잡한 패턴을 사람이 일일이 정의하기 어렵고
👉 모델 성능도 어느 순간 정체되기 시작했습니다.
4. 딥러닝의 등장: “인간의 뇌를 흉내 내다”
이 한계를 극복하기 위해 등장한 것이 딥러닝입니다.
딥러닝은:
- 인간의 뇌 구조를 모방한 신경망(neural network) 기반
- 데이터를 보고
- 규칙을 스스로 만들고
- 계층적으로 학습합니다.
머신러닝이
“사람이 어느 정도 특징을 정리해 줘야 하는 방식”
이었다면,
딥러닝은
“원본 데이터 그대로 보고 내부에서 판단 기준을 만들어내는 방식”
이라고 볼 수 있습니다.
5. 한때는 딥러닝도 한계가 있었다
사실 딥러닝도 초반에는 크게 주목받지 못했습니다.
이유는:
- 연산량이 너무 많았고
- 신경망 학습에 필요한 성능 한계 때문이었습니다.
즉,
“이론은 좋았지만 현실에서 돌리기엔 너무 무거웠다”
는 상황이었습니다.
6. 상황을 바꾼 두 가지: 데이터 폭증 + GPU
이 상황을 완전히 바꾼 것이 두 가지입니다.
① 데이터의 폭발적인 증가
- 인터넷
- 스마트폰
- SNS
로 인해 학습에 사용할 데이터가 압도적으로 증가
② GPU 기반 병렬 연산
- GPU는 대량의 연산을 동시에 처리하는 데 특화
- 딥러닝 신경망 학습에 최적
이 두 가지가 결합되면서
딥러닝은 기존 머신러닝으로는 풀기 어려웠던 문제들에서도
압도적인 성능을 보여주기 시작했습니다.
7. 결과: AI 기술의 급속한 발전
이후 연구자와 개발자들의 관심이 집중되면서
딥러닝은 빠르게 발전했고,
대표적인 성과가:
- 얼굴 인식
- 음성 인식
- 이미지 분류
- 자연어 처리
입니다.
그리고 이 흐름의 연장선에
지금 우리가 사용하는 LLM(대규모 언어 모델) 이 존재합니다.
마무리 정리
- 규칙 기반 → 머신러닝 → 딥러닝
- 핵심 차이점은
👉 사람이 규칙을 정하느냐,
👉 모델이 스스로 규칙을 만들어내느냐 - 데이터와 연산 성능이 딥러닝 시대를 열었다
LLM을 이해하려면
이 머신러닝 → 딥러닝의 전환 흐름을 먼저 아는 것이 정말 중요하다고 느꼈습니다.
#머신러닝 #딥러닝 #오픈ai #LLM