맥킨지의 릴리 사례는 기업용 AI 시장을 위한 핵심 개발 아이디어를 제공합니다. 엣지 컴퓨팅과 소규모 모델에 대한 잠재적 시장 기회입니다. 10만 건의 내부 문서를 통합하는 이 AI 비서는 직원의 70%가 도입했을 뿐만 아니라, 주당 평균 17회나 사용되고 있습니다. 기업용 도구에서는 이런 제품 접착력이 흔치 않습니다. 제 생각은 다음과 같습니다.
1) 기업 데이터 보안은 골치 아픈 문제입니다. 맥킨지가 지난 100년 동안 축적한 핵심 지식 자산과 일부 중소기업이 축적한 특정 데이터는 매우 민감하며 퍼블릭 클라우드에서 처리되지 않습니다. "데이터가 로컬 위치를 벗어나지 않고, AI 역량이 손상되지 않는" 균형 상태를 탐색하는 방법은 실제 시장 수요입니다. 엣지 컴퓨팅은 탐색적 방향입니다.
2) 소규모 전문 모델이 대규모 일반 모델을 대체할 것입니다. 기업 사용자에게 필요한 것은 "수십억 개의 매개변수와 모든 기능을 갖춘" 일반 모델이 아니라 특정 분야의 질문에 정확하게 답할 수 있는 전문적인 비서입니다. 이와 대조적으로 대형 모델의 다재다능함과 전문적인 깊이 사이에는 자연스러운 모순이 존재하며, 기업 시나리오에서는 소형 모델이 더 중요하게 여겨지는 경우가 많습니다.
3) 자체 구축한 AI 인프라와 API 호출 간 비용 균형: 엣지 컴퓨팅과 소규모 모델을 결합하면 초기 투자 비용이 많이 들지만 장기 운영 비용은 크게 절감됩니다. 45,000명의 직원이 자주 사용하는 AI 모델이 API 호출에서 나왔다고 상상해보세요. 이로 인한 의존성, 사용 규모 확대, 제품 리뷰로 인해 대기업과 중견기업이 자체적으로 AI 인프라를 구축하는 것이 합리적인 선택이 될 것입니다.
4) 엣지 하드웨어 시장의 새로운 기회: 대규모 모델 학습은 하이엔드 GPU와 분리할 수 없지만, 엣지 추론에는 완전히 다른 하드웨어 요구 사항이 있습니다. Qualcomm, MediaTek 등의 칩 제조업체에서 출시한 엣지 AI에 최적화된 프로세서는 좋은 시장 기회를 보이고 있습니다. 모든 회사가 자체 "릴리"를 만들고자 할 때, 낮은 전력 소비와 높은 효율성을 위해 설계된 엣지 AI 칩은 인프라에 필수가 될 것입니다.
5) 분산형 웹3 AI 시장도 성장하고 있습니다. 기업의 컴퓨팅 파워, 미세 조정, 소규모 모델에 대한 알고리즘에 대한 수요가 증가하면 리소스 스케줄링을 어떻게 균형 있게 조정할지가 문제가 될 것입니다. 기존의 중앙 집중식 리소스 스케줄링은 문제가 될 것이며, 이는 web3AI 분산형 소규모 모델 미세 조정 네트워크, 분산형 컴퓨팅 파워 서비스 플랫폼 등에 대한 시장 수요를 직접적으로 가져올 것입니다.
시장에서는 아직 AGI의 일반적인 기능 경계에 대한 논의가 진행 중이지만, 많은 기업 사용자가 이미 AI의 실용적 가치를 탐구하고 있다는 점은 더욱 기쁩니다. 물론 과거 컴퓨팅 파워와 알고리즘을 놓고 경쟁하던 자원 독점의 도약과 비교하면, 시장이 엣지 컴퓨팅 + 소규모 모델 방식에 집중하게 되면 시장 활력이 더욱 커질 것입니다.