예술기술융합 환경에서의 비정형 데이터 기반 AI 모델 개발의 구조적 한계

예술기술융합 환경에서의 비정형 데이터 기반 AI 모델 개발의 구조적 한계
임주왕

들어가며 : 심층적 고찰 - 표현 불일치와 해석 불가능성 :
예술기술융합 AI 모델 설계의 난점 - 비정형 데이터와 일반화 실패 : 예술기술융합을 위한 AI 방법론의 비판적 고찰 - 예술기술융합 맥락의 AI 학습 설계에서의 제약과 실패 요인 분석 - 예술기술융합형 AI 모델 개발의 실천적 한계와 방법론적 대응

일러두기 - 현재 연구중인 내용들이기 때문에, 확실한 근거가 부족할 수
있습니다. - 대체로 ‘가설’, ‘가정’적인 내용이며, 부정확한 면이 많습니다. - ‘그것도 맞을 수 있고, 이것도 맞을 수‘ 있습니다. - (확실히 검증된 것들은 별로 없습니다) - 아이디어성 의견이 많으니, 참고 정도로 생각해 주시면 좋겠습니다.

연구의 목적 (왜 하는가) : 요약 (맥락이 부족할 수 있습니다)
- Tech Base 전공자이긴 하지만, 컴퓨터공학은 아님 - 인공지능이 발전하기 시작함 - 이것저것 하다 보니, 인문학 분야 공부도 하게 됨 - Transformer, ML 기반으로 AI가 발전하고 있음 - 예술분야 (미학) 분야를 접목시키면 AI 발전에 도움이 되지 않을까? 하는 생각 (예술을 공부하는 목적)

연구의 목적 (2) 잘 되나요? (네)

목차(내용 요약) 서론 : 예술기술융합 AI의 도전 과제 데이터 측면
: 비정형성, 비표준성, 구조화 불가능성 학습 측면 : 일반화 실패와 모델 불안정성 표현 및 해석의 한계 : 표현 불일치와 해석 불가능성 실질적인 결과 : 성능 저하와 적용 시 예상되는 실패 현재의 방향과 앞으로의 길 결론 및 질의응답

예술기술융합 관련 – 예술적 측면 * 예술과 기술의 새로운 지평
: 융합의 필요성 • 창의적 표현의 확장 : AI 기술은 예술가에게 새로운 창 작 도구와 표현 방식을 제공 • 새로운 경험의 창출 : 관객은 AI가 만들어내는 상호작용 적이고 몰입적인 예술적 경험을 체험 • 산업적 가치 : 예술 콘텐츠의 생산, 유통, 소비 방식에 혁신을 가져올 잠재력을 가짐

예술 측면에서의, AI의 도전 과제 - AI 모델은 : 융합의
핵심 동력이 됨 (되었음, 되고 있음) • 데이터 기반의 예술창작 : AI는 방대한 예술 데이터를 학습하여 새로운 패턴을 발 견하고 창의적인 결과물을 생성할 수 있음 • 상호작용적 시스템 : 실시간 센서 데이터 등을 활용하여 관객과의 동적인 상호작 용이 가능함 • 개인화된 예술 경험 : 사용자 선호도를 학습하여 다양한 예술 콘텐츠를 제공할 수 있음 https://www.aihub.or.kr/

비정형 데이터의 예술적 역할 * 비정형 데이터 : 예술의 본질적
요소 • 음악, 시각 예술, 행위 예술 등 : 많은 예술 장르는 텍스트, 이미지, 음성, 영상, 동 작 등 비정형 데이터로 구성됨 • 다양한 의미와 맥락 : 비정형 데이터는 인간의 감성, 의도, 미적 가치 등 표준화하 기 어려운 풍부한 정보를 담고 있음 -> 맥락(우선) • AI 모델 개발의 핵심 : 이러한 비정형 데이터를 AI가 이해하고 활용하는 것이 예 술기술융합 AI의 성공에 필수적인 데이터가 될 것임

현재의 난점 * 고민 : 구조적 한계와 난점 • 예술기술융합
맥락에서 비정형 데이터를 활용한 AI 모델의 개발은 -> 데이터의 비표준성, 구조화 불가능성, 그리고 해석 불가능성이 핵심 제약 • 본 발표에서는 이러한 구조적 한계와 난점을 분석하고, 실질적인 성능 저하 및 적용 실패로 귀결되는 문제점을 다루고자 함

연구의 목표 - 연구 과정에 있어 여러 실패가 예상되고, 이에
따른 어려운 점들을 분석 - 현재 우리가 AI개발에 있어 나아가고 있는 방향과, 앞으로의 계획에 관한 논의 - 예술기술융합을 적용한 AI 모델 개발의 효율성과, 가능성을 높이기 위한 통찰을 제공하고자 함

예술데이터의 특성 : 비정형성, 비표준성, 구조화 불가능 성 - 이는
예술 데이터의 고유한 특성 - 예술 데이터는 본질적으로 다형성(polymorphic)과 모호성(ambiguity)을 지니고 있음 - 이는 전통적인 AI/ML 방법론으로 다루기 어려운 복잡성을 내포한다. -> 데이터의 비표준성, 구조화가 어려운 점 -> ML : 컴퓨팅(계산가능, 벡터화) 가 되어야 함

On the Theoretical Limitations of Embedding-Based Retrieval • 벡터 임베딩(vector
embedding) 구조의 근본적인 수학적 한계 • 출처 : AI타임스(https://www.aitimes.com) https://arxiv.org/abs/2508.21038

데이터의 한계 - 고차원·저밀도 특성 - 고차원성 : 이미지의 픽셀값,
음원의 주파수 스펙트럼 등 데이터 포인트 하나하나 가 매우 많은 차원을 가짐 - 저밀도성 : 고차원 공간에서 유의미한 예술 데이터는 극히 일부 영역에만 존재하 며, 데이터 포인트 간의 거리가 멀어 학습이 어려움 - 수집된/학습할 데이터는 고차원·저밀도 특성을 가지는 경우가 많음 -> 문제점: 차원의 저주(Curse of Dimensionality) 및 과적합(Overfitting) 위험이 증가

데이터의 비표준성과 비균질성 - 자연계의 다양한 형식과 출처 : 예술
데이터는 디지털 이미지, 회화, MIDI, 음향, 무용 영상(동작) 등의 다양한 형식으로 존재 - 데이터셋의 비균질성 : 특정 장르나 작가에 따라 데이터의 구조, 품질, 양이 크게 다름 - AI 모델 개발에 있어 데이터의 비표준성은 핵심적 제약으로 작용 -> 데이터 통합의 어려움, 복잡한 전처리 과정 및 편향 발생의 위험이 있음

다양한 장르의 춤사위 동 작 데이터 • AI-hub 구축 데이터

구조화 불가능성 (Unstructurability) - 내재된 복잡성 : 예술 작품은 객관적인
수치나 범주로 쉽게 정의될 수 없는 주관 적이고 추상적인 요소들을 포함한다 ("아름다움", "창의성“ 등) -> ‘아름다운 것’을 어떻게 구조화(계량화)할 수 있는가? - 의미의 다층성 : 하나의 예술 작품도 다양한 해석과 맥락을 가질 수 있음 (사실상 그것을 목표로 함) - 이는 엔지니어링의 한계 및 예술적 의미의 손실을 초래할 수 있음 (그러나 언젠가는 해야 함)

정형화 과정에서의 정보 손실 - 미묘한 뉘앙스의 유실 : 예술
데이터의 미묘한 색감, 톤, 음향의 잔향 등 예술적 의도를 담은 미세한 뉘앙스나 맥락이 이 과정에서 쉽게 유실될 수 있음 -> 데이터 정형화 과정에서 정보 손실이 빈번하다. -> 예술성 저하 및 원본 복원의 어려움. -> 예술작품을 관람하실 일이 있다면, ‘이걸 어떻게 데이터화할까’ - 원본 손실 : 붓터치, 질감, 재료의 특성 등 물리적 정보는 디지털 이미지로 변환 시 상당 부분이 소실됨 (색감은 더 좋을 수 있음) - 스타일 전이 (Style Transfer) AI는 색상, 형태 등 표면적인 특징은 모방하지만, 작 가의 심오한 의도나 감정까지는 포착하기 어렵다. -> 현재의 AI로 만든 예술의 현실은?

데이터 학습/해석적 한계 (여러 가지 중) - 복잡한 패턴 :
비정형 데이터는 복잡하고 비선형적인 패턴을 가지고 있어, AI 모델이 이를 효과적으로 학습하는 데 어려움이 있음 - 표준 벤치마크 부재 : 예술 분야에서는 AI 모델의 성능을 객관적으로 평가할 수 있는 표준화된 벤치마크 데이터셋이나 평가 지표가 부족 (시도는 되고 있음) - 학습된 AI 모델이 학습 데이터에 없는 새로운 데이터에 대해 정확하게 예측하거나 적 절한 반응을 보이지 못하는 현상들이 있음 - 비정형 데이터의 특성 : 비정형 데이터의 고유한 복잡성과 다양성으로 인해, 특정 데이 터셋으로 학습된 모델이 다른 예술 작품이나 스타일에는 적용되기 어려운 면이 있음 -> 학습 과정에서의 일반화 불가능성 문제, 예술적 다양성 포용 불가 및 실용적 가치 저 하

인지적 편향 (Cognitive Bias) - 학습 데이터의 편향 : 학습
데이터에 내재된 특정 시대, 문화, 성별, 취향 등의 편 향 - 생성 결과의 편향 : AI가 생성하는 작품이 특정 스타일이나 경향에 치우치게 되어, 다양성을 해치고 획일적인 결과물을 낼 수 있음 -> AI가 만든 것들만을 가지고, 현상을 분석해 볼 필요가 있음 -> ‘AI도 문화다’ 라고 인식하는 것이 필요 (주체성은 배제하더라도) -> 데이터의 비표준성과 정형화 과정에서의 정보 손실은 편향적 위험을 높여, 모델의 일반화 능력을 저해함 https://www.simplypsychology.org/cognitive-bias.html

표현 및 해석의 한계 - Explainable AI (XAI) -현재의 XAI
: 주로 분류/예측 모델의 근거를 설명/해석하는 데에 초점 - 생성된 XAI의 난점 : 예술 작품 생성 모델은 이러한 ‘결정된 근거‘ 를 넘어, 창의적 과정과 미학적 의도를 설명해야 하는데, 이를 어떻게 해석할 것인가 - 설명 가능성의 확보가 어렵다는 것은, 모델의 해석 불가능성이 주요 문제일 수 있 음

예술가와 연구자의 이해 장벽 - 예술가 : AI 모델의 내부
작동을 이해하지 못하면, AI를 단순한 '도구' 이상으로 활용하기 어려움 - AI 연구자 : 모델이 왜 특정 성능을 보이는지, 어떤 부분에서 한계가 있는지 정확 히 파악하기 어렵기 때문에, 모델의 개선 및 발전에 어려움이 있음 -> 현장의 이야기는? - 이러한 이해 장벽은 표현 불일치와 해석 불가능성에서 파생되며, 예술기술융합 요소를 적용한 AI 분야의 혁신을 저해할 수 있음

생각 : 근본적인 해결책 - 예술기술융합 분야에서 AI 모델이 실질적인
가치를 창출하고 폭넓게 활용되기 위 해서는, 이러한 근본적인 한계들에 대한 해결책 모색이 필수적 -> 현재 AI의 발전 방향은 어떠한가? -> 관련 H/W는? (AI반도체) - 기술적 한계를 넘어, 예술적 맥락을 깊이 이해하고 반영할 수 있는 새로운 접근 방식이 요구됨 - 기술적 개선을 넘어, 예술적 통찰과 공학적 방법론의 융합이 중요

방법 (현재로서의) - 예술 데이터 전용 데이터셋 구축: -> 레이블링의
전문성을 확보하고, 다양한 형식의 데이터를 통합하는 표준화된 데 이터셋의 구축 -> 예술가, 큐레이터 등 전문가의 협력을 통한 고품질 데이터 확보 - 데이터 증강(Data Augmentation) 기법 개발 -> 제한된 비정형 예술 데이터의 양을 늘리기 위한 효과적인 증강 기법을 연구 -> 데이터의 비표준성, 구조화 불가능성, 고차원·저밀도 특성 등 데이터 한계를 극 복하기 위한 다각적인 노력이 필요 -> 원본 데이터셋 구축 시의 품질이거나, 해석이 중요

데이터 품질부터 https://www.hankyung.com/article/2025091553471

인간 문화 중심의 AI 모델 설계 - 표현 불일치 감소를
위한 모델 구조 개선 -> 예술적 의도나 맥락을 명시적으로 인코딩할 수 있는 모델 아키텍처 연구 - 생성된 예술 작품의 '어떤 특징'이 '왜' 중요한지 설명할 수 있는 기법 개발 - 데이터 편향성 최소화 -> 다양한 문화권, 시대, 장르의 예술 데이터를 포함 -> (때로는 편향이 필요할 때도 있습니다만, 구분하여 학습 필요)

학제 간 연구 및 협력의 강화 - 예술학, 철학, 심리학
등 인문사회 분야와의 융합 -> 인간의 창의성, 미학적 가치, 감정 등 예술의 본질적 요소를 AI가 이해하고 표 현하는 방법에 대한 심층 연구 - 공학, 컴퓨터 과학, 디자인 분야와의 시너지 -> 최신 AI 기술을 예술 분야에 최적화하고, 사용자 친화적인 인터페이스 및 경험 디자인 -> 예술기술융합 맥락의 AI 학습 설계에서의 제약 및 실패 요인을 다각도로 분석 하고 해결하기 위해 학제 간 연구가 요구됨 -> 어렵다면, 생각의 전환만 조금 더 해 보셔도 좋습니다.

결론 (요약) - 예술기술융합 AI는 비정형 데이터의 본질적 한계 (비표준성,
구조화 불가능성, 고 차원·저밀도 특성, 정보 손실)에 직면 - 학습 과정의 일반화 불가능성, 모델 불안정성, 설계 복잡도 증가로 이어짐. - 이는 표현 불일치와 해석 불가능성을 야기하며, 실질적인 성능 저하 및 적용 실패 로 귀결됨. - 이러한 한계를 극복하기 위한 데이터, 학습, 표현, 해석, 윤리적, 학제 간 다각적인 노력은 필수 - 서비스 등의 개발에 있어서도, 이와 크게 다르지 않음 (힘드시겠지만 생각하는 게 좋겠죠, 당연하지만) -> UX를 생각하는 느낌 정도로

결론 (덧) • Computational neuroaesthetics https://en.wikipedia.org/wiki/Computational_neuroaesthetics https://bcs.kaist.ac.kr/korean/sub060102

예술기술융합 환경에서의 비정형 데이터 기반 AI 모델 개발의 구조적 한계

예술기술융합 환경에서의 비정형 데이터 기반 AI 모델 개발의 구조적 한계

Lablup Inc.

More Decks by Lablup Inc.

Featured

Transcript