深層学習の登場以降、機械学習と言語処理の距離はぐっと縮まった。機械学習が問題を抽象化して議論するのに対し、言語処理は言語また言語処理タスクに内在する構造や制約を前提としてモデル化を行う。例えば文の処理では文法的制約を与える木構造を前提とし、対訳辞書構築では単語をノード、対訳関係をエッジとする二部グラフを想定する。このような言語処理固有の背景は機械学習分野からは把握しづらい一方、興味深い問題を提起する。また機械学習による構造の数理的モデル化は言語処理に対し強力なツールを提供する。
本チュートリアルでは機械学習による言語処理を支える単語や文の埋め込み手法、内在する構造を木編集距離や最適輸送によりモデル化することで言語処理にアプローチする研究を紹介し、自然言語処理と機械学習分野の相互理解が深まることを目指す。