https://timkellogg.me/blog/2025/01/25/r1
각종 커뮤니티와 기사에서 매우 화제인 이슈 Deepseek, 덕분에 달러 지갑도 좀 가벼워졌다!
24년 내내 주요 모델들이 경량화 하고 있다고 느껴졌는데
뜬금포로 R1이 이걸 가장 잘 해냈고, 철옹성 같던 미국에 입장에선 매우 충격적이었을듯.
스케일링은 한계에 도달했고 단순한 Reinforcement Learning이 현재까지 엄청 좋은 효율을 낸다는걸 증명한데다가, 오픈소스로 갈겨버렸으니 이번년도는 발전 속도를 기대해볼만 할지도?
(캐치프레이즈 Into the unknown, 좀 엣지있는거 같다)