議論:創発の説明の可能性
議論:創発リスク
議論:社会的な変化
最後に、ここで議論された創発能力はモデルの動作に焦点を当てきた。
もう一つの注目すべき質的変化は社会学的なもので、規模の拡大によりコミュニティの言語モデルに対する見方や使い
方が変化する。例えば、NLPは歴史的にタスクに特化したモデルにフォーカスしてたが、最近では、スケーリングに
よって、学習データに明示的にコード化されていない様々なタスクの実行を目的とした単一モデルである
「汎用」モデルの研究と開発が爆発的に増えている。汎用的なモデルがわずかな例で未知のタスクを実行できることか
ら、NLP研究コミュニティ以外でも言語モデルの新しい応用が多数生まれている。
例えば、言語モデルはプロンプトを通じて、
・自然言語の指示をロボットが実行可能な動作に変換したり(Ahn et al., 2022; Huang et al., 2022)、
・ユーザーと対話したり(Coenen et al., 2021; Wu et al., 2021, 2022; Lee et al., 2022b)、
・マルチモーダル推論(Zeng et al.)
創発的な能力の例は数多くあるが、なぜそのような能力が創発されるのかについて、説得力のある説明は
今のところほとんどない。直観的には、例えば、
・多段階推論タスクが、Lステップの逐次計算を必要とする場合、少なくともO(L)層の深さを持つモデルが
必要となるかもしれない。
・世界知識を必要とするタスクの場合、圧縮された知識ベース自体を捉えるのに十分なパラメータを持つモデルが
必要かもしれない。
事前訓練に明示的に含まれることなく、 Few-Shot Promptedで出現能力が観察されているため、リスクも出現しうる
ということである。