AI論文読み会11月 - Speaker Deck

Slide 1

Slide 1 text

AI最新論⽂読み会⼤阪市⽴⼤学　医療⼈⼯知能研究室　植⽥⼤樹

Slide 28

Slide 28 text

Neural Databases ニューラルデータベース No.7 近年、ニューラルネットワークは、⻑年のAI問題、特に⾃然⾔語テキストからの問い合わせへの回答において、⽬覚ましい性能向上を示してきた。これらの進歩は、データベース管理の基本的な前提である「データはあらかじめ定義されたスキーマのフィールドとして表現される」という前提を緩和できるところまでニューラルネットワークを拡張できるかどうかという問題を提起している。この論⽂では、この疑問に答えるための第⼀歩を提示する。我々は、事前に定義されたスキーマを持たないデータベースシステムであるNeuralDBを説明し、更新とクエリは⾃然⾔語で与えられる。我々は、最新の⾃然⾔語処理法によって提供されるプリミティブをベースにしたクエリ処理技術を開発する。まず、事前に訓練された⾔語モデルを動⼒源とする最近のNLP変換器は、関連する事実の正確なセットが与えられれば、選択-プロジェクト-結合の問い合わせに答えることができることを、コア部分で実証する。しかし、これらの変換器は⾃明なデータベース以外のデータベースには拡張できず、集約クエリも実⾏できない。これらの知⾒に基づいて、我々は、複数のニューラルSPJ演算⼦を並列に実⾏する NeuralDBアーキテクチャを記述する。これらの演算⼦の結果は、必要に応じて集約演算⼦に与えられる。我々は、Neural SPJ演算⼦のそれぞれに供給されるべき適切な事実のセットを作成する⽅法を学習するアルゴリズムを記述する。重要なことは、このアルゴリズムは、Neural SPJ演算⼦⾃体で学習できるということである。我々は、NeuralDBとそのコンポーネントの精度を実験的に検証し、何千もの⽂を超えるクエリに⾮常に⾼い精度で答えることができることを示している。 →新しい⾃然⾔語系データベース作ったよ。

Slide 52

Slide 52 text

Neural Databases ニューラルデータベース No.6 近年、ニューラルネットワークは、⻑年のAI問題、特に⾃然⾔語テキストからの問い合わせへの回答において、⽬覚ましい性能向上を示してきた。これらの進歩は、データベース管理の基本的な前提である「データはあらかじめ定義されたスキーマのフィールドとして表現される」という前提を緩和できるところまでニューラルネットワークを拡張できるかどうかという問題を提起している。この論⽂では、この疑問に答えるための第⼀歩を提示する。我々は、事前に定義されたスキーマを持たないデータベースシステムであるNeuralDBを説明し、更新とクエリは⾃然⾔語で与えられる。我々は、最新の⾃然⾔語処理法によって提供されるプリミティブをベースにしたクエリ処理技術を開発する。まず、事前に訓練された⾔語モデルを動⼒源とする最近のNLP変換器は、関連する事実の正確なセットが与えられれば、選択-プロジェクト-結合の問い合わせに答えることができることを、コア部分で実証する。しかし、これらの変換器は⾃明なデータベース以外のデータベースには拡張できず、集約クエリも実⾏できない。これらの知⾒に基づいて、我々は、複数のニューラルSPJ演算⼦を並列に実⾏する NeuralDBアーキテクチャを記述する。これらの演算⼦の結果は、必要に応じて集約演算⼦に与えられる。我々は、Neural SPJ演算⼦のそれぞれに供給されるべき適切な事実のセットを作成する⽅法を学習するアルゴリズムを記述する。重要なことは、このアルゴリズムは、Neural SPJ演算⼦⾃体で学習できるということである。我々は、NeuralDBとそのコンポーネントの精度を実験的に検証し、何千もの⽂を超えるクエリに⾮常に⾼い精度で答えることができることを示している。

Slide 57

Slide 57 text

Multi-agent Social Reinforcement Learning Improves Generalization マルチエージェント社会強化学習が⼀般化を向上させる No.10 社会的学習は、⼈間や動物の知能の重要な要素です。社会学習者は、環境の専⾨家の⾏動から⼿がかりを得ることで、洗練された⾏動を身につけ、新しい状況に迅速に適応することができる。本論⽂では、マルチエージェント環境における独⽴強化学習(RL)エージェントが、他のエージェントからの⼿がかりを利⽤して、社会学習を利⽤してパフォーマンスを向上させることができるかどうかを調査する。その結果、バニラモデルを持たないRLエージェントは、個⼈の探索にコストがかかる環境であっても、ほとんどの場合、社会学習を利⽤しないことがわかった。この⽋陥の理由を分析し、モデルベースの補助損失を導⼊することで、困難な探索課題を解くために専⾨家からの⼿がかりを活⽤するようにエージェントを訓練できることを示す。これらのエージェントによって学習された⼀般化された社会学習⽅針によって、エージェントは訓練した専⾨家を上回る性能を発揮するだけでなく、専⾨家のいる新しい環境に配備された場合には、単独学習者よりも優れたゼロショット転送性能を達成することができる。⼀⽅、社会学習に依存した学習をしていないエージェントは、⼀般化が悪く、転送タスクでは成功しない。さらに、マルチエージェントと単独学習を混在させることで、専⾨家がいない場合でも、社会学習を利⽤して単独学習したエージェントよりも優れたパフォーマンスを発揮するエージェントを得ることができることを発⾒した。このことは、社会学習がエージェントのタスクそのものの表現⼒を向上させることに役⽴っていることを示している。我々の結果は、社会学習が RLエージェントのタスクのパフォーマンスを向上させるだけでなく、新しい環境への⼀般化を向上させることを可能にすることを示している。 Google →強化学習に社会学習を

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Slide 37

Slide 37 text

Slide 38

Slide 38 text

Slide 39

Slide 39 text

Slide 40

Slide 40 text