Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Langsmith (自然言語処理システム) と良い関係を築くには

Langsmith Inc.
September 25, 2021

Langsmith (自然言語処理システム) と良い関係を築くには

Laboratory Automation月例勉強会 / 2021.09でのトーク資料です.
https://laboratoryautomation.connpass.com/event/215795/

Langsmith Editorの詳細: https://ja.langsmith.co.jp/
ブラウザ版システム: https://editor.langsmith.co.jp/
フリートライアルなど提供しております.

Langsmith Inc.

September 25, 2021
Tweet

More Decks by Langsmith Inc.

Other Decks in Technology

Transcript

  1.  自然言語処理?  人間が日常的に使う言語 (自然言語) を機械で扱う技術  分野の究極的なゴールは,人のように言語を「理解」するシステムの実現 自然言語処理で論文執筆支援 2

    認知科学・ 言語学・心理学… 情報科学・ 人工知能・数学… 自然言語 処理 身近な応用例: 機械翻訳 (最近はDeepLも有名)
  2.  自然言語処理?  人間が日常的に使う言語 (自然言語) を機械で扱う技術  分野の究極的なゴールは,人のように言語を「理解」するシステムの実現  深層学習の発展により,特に近年盛り上がり中

    自然言語処理で論文執筆支援 3 認知科学・ 言語学・心理学… 情報科学・ 人工知能・数学… 自然言語 処理 身近な応用例: 機械翻訳 (最近はDeepLも有名) 言語理解を問うベンチマークタスクでの性能 人間 2019年 2021年 分野内で最も権威ある学会への論文投稿数 2019年時点 モデルの超大規模化 https://leaderboard.allenai.org/anli/submissions/public https://medium.com/syncedreview/acl-2019-reports-record-high-paper- submissions-begins-notifying-accepted-authors-bbfb13adf405 https://www.arxiv-vanity.com/papers/2104.04473/
  3.  (広く物書きにおいて) よくある失敗ケース  「自分は」伝わると思っていた  他にもっと良い言い回しはありそうだが,良い表現を思いつけなかった  客観的な読み手・アドバイザーがいると助かる 

    こういうことを言いたいということであってますか?  こんな言い方のほうが良いのでは?(こういう言い方をしない理由はありますか?) 背景: 論文執筆・研究室あるある 5 一人の世界
  4.  英語論文執筆指導を一人ひとりに対してきめ細かに行う人的リソースが 足りない  日本人が多い研究室の場合,マジョリティが英語ノンネイティブなので,そもそも英語について相談でき る人が少ない  リモート環境,気軽に聞けない  学生側が英語論文執筆が初めてで,そもそもアカデミック・ライティン

    グについてよく分かっていない  (そもそも,同じ内容・結果でも,どう書くか・伝えるかという部分で論文の完成度が大きく変わることに 気づいていない) 背景: 論文執筆・研究室あるある 8 ???「論文またアップデートしたら見せてね」 (何をしたら良いか一人で悩む)  締め切り前に事故 論文をアップデートしながら,共著者や周りの人に読んでもらう.わかりにくい部分に気づき修正していく. 理想 起こり得る現実
  5.  英語論文執筆指導を一人ひとりに対してきめ細かに行う人的リソースが 足りない  日本人が多い研究室の場合,マジョリティが英語ノンネイティブなので,そもそも英語について相談でき る人が少ない  リモート環境,気軽に聞けない  学生側が英語論文執筆が初めてで,そもそもアカデミック・ライティン

    グについてよく分かっていない  (そもそも,同じ内容・結果でも,どう書くか・伝えるかという部分で論文の完成度が大きく変わることに 気づいていない) 背景: 論文執筆・研究室あるある 9 ???「論文またアップデートしたら見せてね」 (何をしたら良いか一人で悩む)  締め切り前に事故 論文をアップデートしながら,共著者や周りの人に読んでもらう.わかりにくい部分に気づき修正していく. 理想 起こり得る現実 ここを自動化したい!
  6.  良い関係?  Langsmith (自然言語処理技術) に何を期待すると,うまく協働できるか  ユーザの期待とシステムの挙動に乖離があると,フラストレーションがたまる Langsmith (自然言語処理システム)

    と良い関係を築くには 13 自然言語処理技術が進展したので,言語処理システムは間違ったことを言わない なんか分野が進展しているらしいし… 例えば…
  7.  良い関係?  Langsmith (自然言語処理技術) に何を期待すると,うまく協働できるか  ユーザの期待とシステムの挙動に乖離があると,フラストレーションがたまる Langsmith (自然言語処理システム)

    と良い関係を築くには 14 自然言語処理技術が進展したので,言語処理システムは間違ったことを言わない 特に常識的な知識が言語処理システムには欠如しているので, 人にとってありえない間違いをする.数量表現や否定も苦手. 時々わけの分からない記号列の繰り返しを生成したりもする. 今のところの人知 (分野) の限界. なんか分野が進展しているらしいし… 例えば… https://huggingface.co/cl-tohoku/bert-base-japanese-whole-word-masking           言語処理システムで稀に起きそうな誤生成の例: ユーザ 怖いよーーー
  8.  良い関係?  Langsmith (自然言語処理技術) に何を期待すると,うまく協働できるか  ユーザの期待とシステムの挙動に乖離があると,フラストレーションがたまる Langsmith (自然言語処理システム)

    と良い関係を築くには 15 自然言語処理技術が進展したので,言語処理システムは間違ったことを言わない 機械翻訳の結果が 間違ってた!危険! もう使わない! そもそも翻訳誤りが許されない状況で使うべきでない 間違っているかもしれないという前提で使うべき なんか分野が進展しているらしいし… 例えば… よく見る光景 特に常識的な知識が言語処理システムには欠如しているので, 人にとってありえない間違いをする.数量表現や否定も苦手. 時々わけの分からない記号列の繰り返しを生成したりもする. 今のところの人知 (分野) の限界.
  9.  良い関係?  Langsmith (自然言語処理技術) に何を期待すると,うまく協働できるか  ユーザの期待とシステムの挙動に乖離があると,フラストレーションがたまる Langsmith (自然言語処理システム)

    と良い関係を築くには 16 例えば… 自然言語処理システムは間違ったことを言う可能性があるので使えない 使う使わないは個人の自由だが,正しく使いこなせる人とそうでない人で 生きやすさ?が大きく変わる可能性はある. (自然言語処理技術に限らず) 間違う≠使えない
  10.  良い関係?  Langsmith (自然言語処理技術) に何を期待すると,うまく協働できるか  ユーザの期待とシステムの挙動に乖離があると,フラストレーションがたまる Langsmith (自然言語処理システム)

    と良い関係を築くには 17 例えば… 自然言語処理システムは間違ったことを言う可能性があるので使えない 使う使わないは個人の自由だが,正しく使いこなせる人とそうでない人で 生きやすさ?が大きく変わる可能性はある. (自然言語処理技術に限らず) 間違う≠使えない 例:機械翻訳のうまい使い方 - 自分で書いた英文が想定した意味になっているかを確かめるために,英日翻訳をかけながら見直しをする 機械翻訳ですらちゃんと理解してくれるなら,そこまで複雑で誤解を与えるような文ではないだろう - 英語の別の言い回しを探すために,自分で書いた英文を一旦適当な言語に翻訳して,もう一度英語への翻訳を かける (綺麗な英文になることが多い) - 長い英語の文章を一旦翻訳して全体の大まかな論旨を掴んでから,英文を読みはじめる 実は,Langsmithはこれと 似たようなアプローチ
  11.  Langsmith利用の勝ちパターン Langsmithを擬似読み手・自習教材だと思って欲しい 20 あなたが書いている文と提案されている文の違いを説明できますか? 主語をWeにすべき特別な理由があるんですね? どういう時に”We”という主語を置くべきな んだろう? 文頭に置くべき要素はどんな情報なのだろう 受動態はダメと言われるけど,どういう場合

    は許容なのかな 考えるべきことへの気付き 聞く・調べる 文を改善 質問が提起されたと考える ???「論文またアップデートしたら見せてね」 (何をしたら良いか一人で悩む)  締め切り前に事故 Langsmithにかけながら,自分の文章を省みる
  12.  自然言語処理サービスに対して持つべきマインド  システムは言語を「理解する」ところまでは至っていないため間違う.  技術の使い方・捉え方次第で恩恵を享受できる.(気づいたもの勝ち)(絶対に間違えないことを求めた使い方は正しくないかも?)  Langsmithについて持つべきマインド  システムの提案は「この言い回しではなくていいのですね?」という質問.問題提起.

     提案を受け入れるべきか考えることがトレーニングになる  人らしい先入観も時に無いため,変な提案をすることもある  システムはあなたが頭の中で考えている書きたいことや,書かれていない実験結果などを知らない  Langsmith使い方のコツ  書き換え機能で修正がたくさんある場合,何か不自然な文になっている可能性が高いと疑うと良い  同じ文に何回も書き換え機能を適用すると,どんどん良くなっていく場合がある  書き換え機能以外にも色々な機能がある  有料会員になると,機能の制限が外れる まとめ 21
  13.  上に出る候補ほど論文に書かれる文として典型的  緑: 足された単語  赤: 消された単語が存在した場所 書き換え 25

    前後の文脈も出力に (若干) 影響を与える (ただし現状,冠詞や接続詞の選択については弱い印象) 書き換えがうまく行われない場合は,文区切りを確認したり,特殊なトークン (latexの記号など) を除くとより良い候補が提示される場合がある.
  14.  汚ない文を論文として適切な文に書き換えるよう ニューラルネットワークを学習  決まったルールを適用しているわけではない  変な出力をする可能性もある.あくまで探索的な推敲を支援する (気づきを与え る) ことが目的であり,校正ツールではない.

     既存の論文にある文をコピーしているわけではない  とはいえ,偶然既存論文と同じ文を書く可能性はあるので, (本ツールの使用に関係なく) 剽窃チェックはしてほしい. 補足: 書き換え 29 We shows results at Table 1 モデル The results are shown in Table 1.