ENOG89 Meeting で発表した資料です。 なんとなくどんな感じで動いているかと学習って何やってんのかにフォーカスしていて、 埋め込みや自己注意や MoE などの LLM の重要技術には全くふれてません。時間もなかったし。 なんで生成系 LLM が最近こんなに頭が良くなってるのかはなんとなくわかるようになるかも?