UMCP – MS/BS of ECE in Seoul National University ▪ Industry – Co-Founder, CDO, and Head of Research in Sionic AI – Leader of Various AI R&D Teams in NAVER CLOVA – Co-Founder and Head of Research in Company.AI – Data Scientist in Pikicast – Senior Engineer in Samsung Electronics
보고서 ('24.06) – AI는 향후 10년간 미국 GDP를 0.9%~6.1% 올릴 것이며 모든 작업의 약 25%까지 담당할 것 – 향후 수년간 1조 달러의 투자가 예상. → 단기간에 AI가 보여주는 성과는 비용 대비 미미한 수준 ▪ 구글 2분기 Earning Call ('24.07) – AI에 대한 과잉 투자에 대한 위험보다 과소 투자로 인한 위험이 "dramatically" 더 크다 ▪ 결국 승자에게는 투자가 되고, 패자에게는 버블이 될 것 – 과거 90년대 닷컴 버블과 비슷한 상황 – 따라서 현재는 너도나도 AI에 대해서 GO를 외치는 상황
Haystack ▪ 매일 폭발적으로 생산/소비되는 데이터 – 2023년 생산 데이터량 ✓ 329 Exabytes / Day ✓ 120 Zettabytes / Year – 매년 지속적으로 20~40%씩 꾸준히 증가 ▪ 데이터 처리는 AI가 잘 할 수 있는 영역 – 사람은 모든 데이터를 살펴볼 수 없음 – AI가 데이터를 수집하고 이해하며 사람이 필요한 정보를 제공하는 보조 역할 ▪ 특히 기업 활동에 있어 매우 필요한 능력
수 년 전부터 미래의 새로운 해자(New Moat)로 언급[1] – 기업에서는 수많은 데이터를 생산되나 제대로 활용하지 못함 – AI 기술의 발전으로 기업에서 생산하는 모든 지식을 저장하고 이해하며 손쉽게 활용할 수 있는 수단으로서 관심이 높아짐 ▪ 앞으로 기업내 데이터의 생성, 저장, 활용 등 모든 면이 AI-native 형태로 변할 것 [1] https://news.greylock.com/the-new-moats-53f61aeac2d9
수 있는 데이터 생성 → AI 기반 앱을 만들고 운영하면서 자연스럽게 축적되고, 이것이 기업의 Core Intelligence를 강화하는 방향으로 나아갈 것 – 기존 데이터를 AI가 활용할 수 있는 형태로 변환 → AI 기반의 데이터 ETL이 점점 주목받을 것 https://www.databricks.com/blog/databricks-mosaicml https://techcrunch.com/2023/06/26/databricks-picks-up-mosaicml-an-openai-competitor-for-1-3b/ https://www.databricks.com/blog/introducing-dbrx-new-state-art-open-llm
대부분의 정보는 ‘글’의 형태로 변환하여 표현 가능 – 인류 역사의 대부분의 지식은 ‘글’의 형태로 저장되어 전해 내려오고 있음 ▪ 효율성이 높음 – 글은 정보를 가장 적은 양으로 표현할 수 있는 수단 – 따라서 동일한 지식 및 정보를 학습할 때 필요한 비용 크게 낮음 ▪ 따라서 Core Intelligence는 LLM 중심으로 발전 – LLM : 두뇌 역할 – 그 외 Modality(이미지, 음성, 동영상 등) : 감각 기관 역할
다음 토큰을 선택하는 과정 – 모델이 모르는 내용이 들어올 때 → Hallucination 확률 ↑ ▪ Frozen Knowledge – LLM은 학습하지 않은 정보(최신 정보, Private 지식 등)를 알 수 없음 – 반면 많은 기업들은 그들의 내부 데이터를 활용한 application을 원함 ▪ High Cost and Latency (in both training and inference)
함 ▪ 비용이 효율적이어야 함 ▪ 쉽고 편리하게 만들고 운영할 수 있어야 함 ▪ 사용 및 운영하면서 지속적으로 쌓이는 지식을 습득하고 똑똑하게 되며, 고객에 맞게 Customize되어야 함 ▪ 기업 고유의 비즈니스 로직과 레거시 시스템과의 연동이 자연스러워야 함 ▪ 등등 매우 다양하고 많은 요구사항들...
추론 : 미리 알려진 사실을 근거로 새로운 판단 또는 결론을 이끌어 냄 ▪ 대표적인 방법론 : Chain of Thoughts(CoT) – 풀이 과정을 LLM이 자연어로 생성. 답변 작성에 활용 Scratchpads Chain of Thoughts 기술 블로그 : https://blog.sionic.ai/llm- Scratchpads : https://arxiv.org/abs/2112.00114 CoT : https://arxiv.org/abs/2201.11903
활용하는데 있어 '추론' 능력이 중요 – 최근 multi-lingual LLM의 발전 속도도 매우 빠름 – 그렇지만 여전히 한국어 추론 능력이 뛰어난 오픈소스 모델은 제한적 ▪ LLM의 종합적인 체감 성능과 일치하는 한국어 벤치마크의 부재 – 기존 벤치마크는 객관식 형태의 특정 task 성능 측정이 대부분 – 전반적으로 뛰어난 성능의 모델과 해당 task만 잘하는 모델을 구분하기 어려움
Enterprise Solution 시장 규모 글로벌 2위 → 매년 두 자릿수의 기업용 SaaS 시장 성장률 ▪ 코로나 이후 AI Transformation 트렌드 → 늦은 디지털 개혁으로 인해 오히려 AI로의 전환이 용이한 상황 ▪ B2B 사업 경험 및 네트워크 → LINE, Softbank, Yamato 과제 등 AI 사업 경험 보유
확장될 것 ▪ 특히, 기업은 고유의 Core Intelligence를 만들고 비즈니스에 적용하는 방향으로 AI를 활용하려고 할 것 ▪ (현재) 공급자 중심의 발전 → (미래) 수요자 중심의 발전 예상 ▪ 기업이 LLM을 활용하기 위해서는 많은 현실적인 문제를 해결해야 함 ▪ 향후 이러한 문제에 효과적인 솔루션을 제공하여 각 기업의 AI Transformation을 가속화하는 곳들에게 큰 기회가 있을 것