14 伝統的な⾳楽の性質を表現できていない ・such as choruses that repeat, or melodies that have a quesOon and answer form ノイズの話 ・ノイズとかスクラッチの⾳などの雑⾳が聞こえる モデルが⽣成できる⾔語やスタイルの多様化 ・今のモデルの学習データは⼤半が英語の曲 ・英語以外の他⾔語も視野に ・⾳楽スタイルの融合で発展してきたという⾳楽の歴史的にも興味深いものと⾒込んでいる 計算時間を短くして、⼈間とのインテラクティブ性を上げたい ・1分の⾳源を完全にレンダリングするのに約9時間 ・並列サンプラーにモデルを蒸留させる⽅法で⾼速化の可能性(参考1, 参考2)