JSAI2024: 大規模マルチモーダルモデルによるプライバシーを保護したデータアノテーション自動化

KYOTO UNIVERSITY KYOTO UNIVERSITY 1 େن໛ϚϧνϞʔμϧϞσϧʹΑΔ   ϓϥΠόγʔΛอޢͨ͠ σʔλΞϊςʔγϣϯࣗಈԽ एҪ༤لɹ஛಺޹ɹࣛౡٱ࢚
ژ౎େֶ

KYOTO UNIVERSITY 2 ݚڀഎܠ

KYOTO UNIVERSITY 3 ݚڀഎܠ: σʔλϓϥΠόγʔΛอޢ͠ͳ͕ΒLMMΛ׆༻ ▪ େن໛ϚϧνϞʔμϧϞσϧ(Large Multimodal Model, LMM)͸
ςΩετ෼ੳɼԻ੠ͷจࣈى͜͠ɼޫֶจࣈೝࣝ౳ͷ   ༷ʑͳλεΫͰֵ৽తͳੑೳΛൃشɽ ▪ ҰํɼLMMਪ࿦αʔϏεͷೖྗσʔλ͸อଘ͞ΕΔɼ   ֶशσʔλͱͯ͠ར༻͞ΕΔՄೳੑ͕ଘࡏɽ ▪ σʔλϓϥΠόγʔΛอޢ͠ͳ͕ΒLMMΛ׆༻͢ΔͨΊͷ ٕज़͕ٻΊΒΕ͍ͯΔ

KYOTO UNIVERSITY 4 ݚڀഎܠ:   େن໛ϚϧνϞʔμϧϞσϧʹΑΔΞϊςʔγϣϯ ▪ σʔλΞϊςʔγϣϯͷࣗಈԽʹLMMΛԠ༻͢Δ ▪ ਓؒͷख࡞ۀͱൺ΂ͯߴ଎͔ͭߴ඼࣭ͳΞϊςʔγϣϯ͕ظ଴͞ΕΔ
▪ ҰํɺLMMར༻࣌͸σʔλͷϓϥΠόγʔอޢ͕ඞཁ ▪ ຊݚڀͰ͸ɺLMMΛ࢖ͬͨը૾ΞϊςʔγϣϯΛର৅ʹɺ   Ξϊςʔγϣϯਫ਼౓ͱൿಗ৘ใอޢΛཱ྆͢Δख๏ΛఏҊ

KYOTO UNIVERSITY 5 ؔ࿈ݚڀ

KYOTO UNIVERSITY 6 ؔ࿈ݚڀ (Data Annotation 1/2) LLMΛ༻͍ͨςΩετΞϊςʔγϣϯ ▪ 2020೥ͷΞϝϦΧେ౷ྖબʹ͓͚Δ
  X(Twitter)ͷςΩετ͔Β੓࣏తॴଐΛΞϊςʔγϣϯ ▪ ChatGPT-4͕ઐ໳ՈɾΫϥ΢υϫʔΧʔΑΓ΋ߴਫ਼౓ɺ ෼ྨͷภΓ͕গͳ͍͔ಉ౳ͷ݁Ռ GPT-4 GPT-4

KYOTO UNIVERSITY 7 ؔ࿈ݚڀ (Data Annotation 1/2) LMMΛ༻͍ͨը૾Ξϊςʔγϣϯ ▪ Visual
ChatGPT(ChatGPTΛಠࣗʹϚϧνϞʔμϧԽͨ͠Ϟσϧ)Ͱ ߤۭࣸਅͷ௚ઢݕग़΍ηάϝϯςʔγϣϯΛߦͬͨɽ ▪ ਫ਼౓͸λεΫͷੑ࣭ʹґଘ ▪ ֶशσʔλʹ͸λεΫ༻ͷσʔλؚ͕·Ε͍ͯͳ͍͕ɼ   શମͱͯ͠ϥϯμϜਪଌΛେ෯ʹ্ճΔਫ਼౓͕ಘΒΕͨ

KYOTO UNIVERSITY 8 ؔ࿈ݚڀ (Privacy-preserving computing 1/2) Cipher GPT ▪
ൿີܭࢉ(σʔλΛ҉߸Խͨ͠··ܭࢉ͢Δ͜ͱ)Λ   େن໛ݴޠϞσϧͰ࣮૷͢Δ͜ͱ͸ݱ࣮తͰͳ͍ɽ ▪ Cipher GPT: ൿີܭࢉ͕ՄೳͳGPT-2   ɹ256τʔΫϯͷೖྗ͔Β256τʔΫϯͷग़ྗʹɼ   ɹฏۉ 24 ෼ͷϨΠςϯγͱ 93 GBͷଳҬ෯͕ඞཁ ▪ ൿີܭࢉ͕Ͱ͖ͳ͍େن໛ϚϧνϞʔμϧϞσϧʹ΋ɼ   ೖྗσʔλΛՃ޻ॲཧ͢Δ͜ͱͰϓϥΠόγʔΛอޢ͢Δ ͜ͱΛ໨ࢦ͢ɽ

KYOTO UNIVERSITY 9 ؔ࿈ݚڀ (Privacy-preserving computing 2/2) ೖྗϓϩϯϓτͷൿಗԽ ▪ Hide
and Seek(HaS)ϑϨʔϜϫʔΫ ▪ ೖྗதͷਓ໊΍࣌ؒ౳ͷہॴతͳػີ৘ใΛಗ໊Խ   ಗ໊Խ⁶ඇಗ໊Խͷஔ׵ؔ܎ΛผͷݴޠϞσϧֶ͕श ▪ ຊݚڀ͸ɼ୯७ͳஔ׵ͰରԠՄೳͳہॴతͳ৘ใͰ͸ͳ͘ɼ จষͷτϐοΫ౳ͷೖྗσʔλશମ͔ΒಘΒΕΔ৘ใͷ   อޢΛର৅ͱ͢Δɽ

KYOTO UNIVERSITY 10 ໰୊ઃఆ

KYOTO UNIVERSITY 11 ໰୊ઃఆ   ຊݚڀͷ໰୊ઃఆ ▪ ຊݚڀͰ͸ը૾ͷΞϊςʔγϣϯλεΫΛ૝ఆɽ ▪ ΞϊςʔγϣϯλεΫ͸LMMͰ΋ղ͘͜ͱ͸Մೳɽ
  ͨͩ͠ɺͦͷλεΫʹಛԽֶͯ͠शͨ͠Ϟσϧͷํ͕ ΑΓߴਫ਼౓ͩͱ૝ఆɽ

KYOTO UNIVERSITY 12 ఏҊख๏

KYOTO UNIVERSITY 1. Ξϊςʔγϣϯ͢Δը૾͔Βෳ਺ͷখ͍͞ը૾Λ੾Γग़͢ 2. খ͍͞ը૾Λࠞ߹͠ɼೖྗը૾Λ࠶ߏ੒͢Δ 3. খ͍͞ը૾͝ͱʹΞϊςʔγϣϯ͢ΔΑ͏ϓϩϯϓτΛ༩͑Δ 4. খ͍͞ը૾ͷΞϊςʔγϣϯ݁ՌΛ౷߹
13 ఏҊख๏   ը૾Λ੾Γग़ͯ͠LMMʹೖྗɺग़ྗΛݩͷը૾ʹ౷߹

KYOTO UNIVERSITY ▪ Ξϊςʔγϣϯͷࠜڌ͸ը૾ͷہॴతͳ෦෼ʹଘࡏ͠ɺ   ϓϥΠόγʔ͸ը૾શମͷ৘ใ͔ΒऔಘͰ͖Δ৔߹ʹ༗ޮ   (ྫ: إݕग़ɾOCR) ▪
Ξϊςʔγϣϯͷࠜڌ: ▪ ը૾ʹਓؒͷإ͕͍ࣸͬͯΔ͔ʁ ▪ ը૾શମ͔ΒಘΒΕΔେҬతͳϓϥΠόγʔ: ▪ ը૾ʹ͍ࣸͬͯΔਓ͕Կͷಈ࡞Λ͍ͯ͠Δ͔ʁ 14 ఏҊख๏   ը૾Λ੾Γग़ͯ͠LMMʹೖྗɺग़ྗΛݩͷը૾ʹ౷߹

KYOTO UNIVERSITY 15 ࣮ݧ

KYOTO UNIVERSITY 16 ࣮ݧ:ਓؒͷإͷΞϊςʔγϣϯ σʔληοτ ▪ ࣮ݧ:   ը૾ʹਓؒͷإ͕͍ࣸͬͯΔ͔True/FalseͰΞϊςʔγϣϯ ▪
2ͭͷσʔληοτΛར༻   ਓؒͷإΛؚΉσʔλ: Stanford 40 Action Dataset ▪ “Cooking”ͳͲͷಛఆͷΞΫγϣϯΛߦ͏   ਓؒͷը૾σʔληοτ ▪ ࣮ݧͰ͸10ͷΞΫγϣϯΫϥεΛબ୒ σʔλྫ

KYOTO UNIVERSITY 17 ࣮ݧ:ਓؒͷإͷΞϊςʔγϣϯ σʔληοτ ▪ ࣮ݧ:   ը૾ʹਓؒͷإ͕͍ࣸͬͯΔ͔True/FalseͰΞϊςʔγϣϯ ▪
2ͭͷσʔληοτΛར༻   ਓؒͷإΛؚ·ͳ͍σʔλ: ADE20K Dataset ▪ “Bedroom”, ”Aquarium” ͳͲ   γʔϯը૾ͷσʔληοτ ▪ ࣮ݧͰ͸ɺਓ͕͍ؒࣸͬͯͳ͍   ը૾Λ100ຕબΜͩ σʔλྫ

KYOTO UNIVERSITY 18 ࣮ݧ:ਓؒͷإͷΞϊςʔγϣϯ ධՁࢦඪ ▪ ࣮ݧͰ͸ɺΞϊςʔγϣϯਫ਼౓ͱϓϥΠόγʔ࿙ӮϦεΫͷ   2ͭͷࢦඪΛධՁͨ͠ ▪
Ξϊςʔγϣϯਫ਼౓:   ɹఏҊख๏ʹΑΔΞϊςʔγϣϯͷਖ਼ղ཰ ▪ ϓϥΠόγʔ࿙ӮϦεΫ:   1. ਓͷإΛؚΉ100ຕͷΞϊςʔγϣϯը૾Λೖྗ   2. ਓ͕ԿͷΞΫγϣϯΛ͍ͯ͠Δ͔10Ϋϥε෼ྨ   3. ෼ྨਫ਼౓ΛϓϥΠόγʔ࿙ӮϦεΫͱͯ͠ධՁ ͜ͷਓ͸ԿΛ   ͍ͯ͠Δ͔ʁ ϓϥΠόγʔ࿙Ӯ   ϦεΫͷධՁ

KYOTO UNIVERSITY 19 ࣮ݧ:ਓؒͷإͷΞϊςʔγϣϯ ਫ਼౓ྼԽ͸ෆՄආ͕ͩɺϓϥΠόγʔ࿙ӮϦεΫ͕େ෯ʹݮগ ▪ ࡉ෼ԽʹΑΓɼΞϊςʔγϣϯਫ਼౓͸௿Լ͢Δ͕   80%Ҏ্ʹอͨΕ͍ͯΔɽ ▪
ҰํɼϓϥΠόγʔ࿙ӮϦεΫ͸େ෯ʹ௿Լ͢Δɽ

KYOTO UNIVERSITY 20 ݁࿦

KYOTO UNIVERSITY 21 ݁࿦ ▪ ຊݚڀͰ͸ɺେҬతͳϓϥΠόγʔΛอޢ͠ͳ͕Β   ΞϊςʔγϣϯΛߦ͏ϑϨʔϜϫʔΫΛఏҊ ▪ Large
Multimodal Model (LMM)Λ༻͍࣮ͨݧΛߦ͍ɺ   Ξϊςʔγϣϯਫ਼౓ͱϓϥΠόγʔ࿙ӮϦεΫͷ   τϨʔυΦϑΛݕূͨ͠ɻ ▪ ఏҊख๏ʹ͓͍ͯը૾Λࡉ͔͘෼ׂ͢Δ͜ͱͰɺ   Ξϊςʔγϣϯਫ਼౓Λҡ࣋͠ͳ͕Βɺ   ϓϥΠόγʔ࿙ӮϦεΫΛେ෯ʹ௿ݮͰ͖Δ͜ͱΛࣔͨ͠

KYOTO UNIVERSITY 22 ࠓޙͷల๬ ▪ େن໛ϚϧνϞʔμϧϞσϧͱΫϥ΢υϫʔΧʔʹΑΔ   ΞϊςʔγϣϯΛൺֱධՁ͢Δ ▪ ςΩετ΍Ի੠Λೖྗͱͨ͠৔߹ʹख๏Λ֦ு͢Δ

JSAI2024: 大規模マルチモーダルモデルによるプライバシーを保護したデータアノテーション自動化

JSAI2024: 大規模マルチモーダルモデルによるプライバシーを保護したデータアノテーション自動化

WY

More Decks by WY

Featured

Transcript

KYOTO UNIVERSITY KYOTO UNIVERSITY 1 େن໛ϚϧνϞʔμϧϞσϧʹΑΔ   ϓϥΠόγʔΛอޢͨ͠ σʔλΞϊςʔγϣϯࣗಈԽ एҪ༤لɹ஛಺޹ɹࣛౡٱ࢚

KYOTO UNIVERSITY 2 ݚڀഎܠ

KYOTO UNIVERSITY 3 ݚڀഎܠ: σʔλϓϥΠόγʔΛอޢ͠ͳ͕ΒLMMΛ׆༻ ▪ େن໛ϚϧνϞʔμϧϞσϧ(Large Multimodal Model, LMM)͸

KYOTO UNIVERSITY 4 ݚڀഎܠ:   େن໛ϚϧνϞʔμϧϞσϧʹΑΔΞϊςʔγϣϯ ▪ σʔλΞϊςʔγϣϯͷࣗಈԽʹLMMΛԠ༻͢Δ ▪ ਓؒͷख࡞ۀͱൺ΂ͯߴ଎͔ͭߴ඼࣭ͳΞϊςʔγϣϯ͕ظ଴͞ΕΔ

KYOTO UNIVERSITY 5 ؔ࿈ݚڀ

KYOTO UNIVERSITY 6 ؔ࿈ݚڀ (Data Annotation 1/2) LLMΛ༻͍ͨςΩετΞϊςʔγϣϯ ▪ 2020೥ͷΞϝϦΧେ౷ྖબʹ͓͚Δ

KYOTO UNIVERSITY 7 ؔ࿈ݚڀ (Data Annotation 1/2) LMMΛ༻͍ͨը૾Ξϊςʔγϣϯ ▪ Visual

KYOTO UNIVERSITY 8 ؔ࿈ݚڀ (Privacy-preserving computing 1/2) Cipher GPT ▪

KYOTO UNIVERSITY 9 ؔ࿈ݚڀ (Privacy-preserving computing 2/2) ೖྗϓϩϯϓτͷൿಗԽ ▪ Hide

KYOTO UNIVERSITY 10 ໰୊ઃఆ

KYOTO UNIVERSITY 11 ໰୊ઃఆ   ຊݚڀͷ໰୊ઃఆ ▪ ຊݚڀͰ͸ը૾ͷΞϊςʔγϣϯλεΫΛ૝ఆɽ ▪ ΞϊςʔγϣϯλεΫ͸LMMͰ΋ղ͘͜ͱ͸Մೳɽ

KYOTO UNIVERSITY 12 ఏҊख๏

KYOTO UNIVERSITY 1. Ξϊςʔγϣϯ͢Δը૾͔Βෳ਺ͷখ͍͞ը૾Λ੾Γग़͢ 2. খ͍͞ը૾Λࠞ߹͠ɼೖྗը૾Λ࠶ߏ੒͢Δ 3. খ͍͞ը૾͝ͱʹΞϊςʔγϣϯ͢ΔΑ͏ϓϩϯϓτΛ༩͑Δ 4. খ͍͞ը૾ͷΞϊςʔγϣϯ݁ՌΛ౷߹

KYOTO UNIVERSITY ▪ Ξϊςʔγϣϯͷࠜڌ͸ը૾ͷہॴతͳ෦෼ʹଘࡏ͠ɺ   ϓϥΠόγʔ͸ը૾શମͷ৘ใ͔ΒऔಘͰ͖Δ৔߹ʹ༗ޮ   (ྫ: إݕग़ɾOCR) ▪

KYOTO UNIVERSITY 15 ࣮ݧ

KYOTO UNIVERSITY 16 ࣮ݧ:ਓؒͷإͷΞϊςʔγϣϯ σʔληοτ ▪ ࣮ݧ:   ը૾ʹਓؒͷإ͕͍ࣸͬͯΔ͔True/FalseͰΞϊςʔγϣϯ ▪

KYOTO UNIVERSITY 17 ࣮ݧ:ਓؒͷإͷΞϊςʔγϣϯ σʔληοτ ▪ ࣮ݧ:   ը૾ʹਓؒͷإ͕͍ࣸͬͯΔ͔True/FalseͰΞϊςʔγϣϯ ▪

KYOTO UNIVERSITY 18 ࣮ݧ:ਓؒͷإͷΞϊςʔγϣϯ ධՁࢦඪ ▪ ࣮ݧͰ͸ɺΞϊςʔγϣϯਫ਼౓ͱϓϥΠόγʔ࿙ӮϦεΫͷ   2ͭͷࢦඪΛධՁͨ͠ ▪

KYOTO UNIVERSITY 19 ࣮ݧ:ਓؒͷإͷΞϊςʔγϣϯ ਫ਼౓ྼԽ͸ෆՄආ͕ͩɺϓϥΠόγʔ࿙ӮϦεΫ͕େ෯ʹݮগ ▪ ࡉ෼ԽʹΑΓɼΞϊςʔγϣϯਫ਼౓͸௿Լ͢Δ͕   80%Ҏ্ʹอͨΕ͍ͯΔɽ ▪

KYOTO UNIVERSITY 20 ݁࿦

KYOTO UNIVERSITY 21 ݁࿦ ▪ ຊݚڀͰ͸ɺେҬతͳϓϥΠόγʔΛอޢ͠ͳ͕Β   ΞϊςʔγϣϯΛߦ͏ϑϨʔϜϫʔΫΛఏҊ ▪ Large

KYOTO UNIVERSITY 22 ࠓޙͷల๬ ▪ େن໛ϚϧνϞʔμϧϞσϧͱΫϥ΢υϫʔΧʔʹΑΔ   ΞϊςʔγϣϯΛൺֱධՁ͢Δ ▪ ςΩετ΍Ի੠Λೖྗͱͨ͠৔߹ʹख๏Λ֦ு͢Δ