Slide 3
Slide 3 text
論⽂情報収集:arXivからのプレプリント情報取得
• 最初はarXiv APIをそのまま叩きに⾏こうとしていたが、うまいクエリが⽣成できずにエラーになってしまった。そこで、arXiv APIのpythonラッパ
ーであるarXivを使うように指⽰したところ、うまく実⾏された。
• 今回、ChatGPTを含むプレプリントを取得している。ブラウザでの検索でも、API経由でもどちらも600件程度(少しズレはある)。
※⾃動⽣成されたクエリ
⽣成されたクエリは、指定条件に則っていないので、ちゃんと⾒直す必要がある。ただし、今回のケースでは
実質似た条件になる。検索している”ChatGPT”という単語は最近のものなので、全期間でも2021年以
降でも同じ。また検索対象がallでも、この単語が出るのは基本的にTitle, Abstractだと考えられるため。