クロスワードを GPT4と量子コンピュータに解かせよう

そうだ、クロスワードを GPT4＆量子コンピュータに解かせよう 2024年1月28日 monta

改めてクロスワードどう解いてる？

クロスワード「カギ」と呼ばれる文章によるヒントを元に、タテヨコに交差したマスに言葉を当てはめてすべての白マスを埋めるパズル。 2 3 4 5 6 7
8 9 10 11 12 13 1 タテのカギ・１外側が硬い海の生き物。・２音を聞く体の部位　　：ヨコのカギ・１大気中の静電気により発生する自然現象・７言葉の表す内容

8 9 10 11 12 13 1 タテのカギ・１外側が硬い海の生き物。・２音を聞く体の部位　　：ヨコのカギ・１大気中の静電気により発生する自然現象・７言葉の表す内容カニかな？カイかな？

8 9 10 11 12 13 1 タテのカギ・１外側が硬い海の生き物。・２音を聞く体の部位　　：ヨコのカギ・１大気中の静電気により発生する自然現象・７言葉の表す内容カニor カイカミナリ、イナズマもありだな。

8 9 10 11 12 13 1 タテのカギ・１外側が硬い海の生き物。・２音を聞く体の部位　　：ヨコのカギ・１大気中の静電気により発生する自然現象・７言葉の表す内容カニor カイカミナリ orイナズマミミ！

8 9 10 11 12 13 1 タテのカギ・１外側が硬い海の生き物。・２音を聞く体の部位　　：ヨコのカギ・１大気中の静電気により発生する自然現象・７言葉の表す内容カミナリミイイミもあってそう

8 9 10 11 12 13 1 タテのカギ・１外側が硬い海の生き物。・２音を聞く体の部位　　：ヨコのカギ・１大気中の静電気により発生する自然現象・７言葉の表す内容答えの候補答えの候補を縦横のカギと、埋まった文字から確定していく遊び

人だけが楽しめる知的な娯楽でした

そう、AIが賢くなるまでは

答えの候補 • 1．カニ、カイ : めんどくさいことはAIにやらせようカギを投げて、解答の候補を生成するなんかイイ感じにする

あとはイイ感じに組合せるだけ

組合せ？

組合せでイイ感じといえば... D-Wave！

lexisrexのクロスワード以下の理由により、英語のクロスワードでチャレンジ・GPT4が英語が得意・日本語は自分が解けるし... https://www.lexisrex.com/English-Crossword-Level-3&id2=2328 問題元：

問題をデータ化現時点ではここは人間。 OpenCV使ったら出来そうだったが、今のところメインの興味範囲でないので保留。

GTP４になげる依頼文生成ヒントを含めた依頼文字列を生成します。枠の長さを見て単語の長さを指定します。 GPT４、おしゃべりで余計な説明やナンバリングをするので、”単語だけカンマ区切りで返せ”と念押しします。 ai_str =
f"#Instructions \nGiven the following as clue, the word for the {word_len}-letter word. ¥n {add_hint_str} ¥nReply only answer words.without numbering.separate with comma.\n#Clues\n{hint_str[0]}"

作った依頼文をGPT４に丸投げほぼ、GPTのAPIサンプルのまま client = OpenAI() return_text = "" for
i in range(max_trial): response = client.chat.completions.create( model="gpt-4", messages=[ {"role":"system","content":"You are a powerful AI and specialize in the ability to help users solve crosswords.The user will give you crossword clues and you will be asked to suggest some possible candidate words. Please answer only the candidate words, separated by commas(no numbering, no explanation)."}, {"role":"user","content":f"{request_str}"}, ], temperature=1.0, top_p=1, max_tokens=256, frequency_penalty=0, presence_penalty=0 )

データを構造化複数回と合わせたときに同じ単語を回答した場合は確度が高いと判断する。そのための出現頻度を押さえておく。 GPT4からの解答回数でdict化

定式化① 選ばれる答えは一つだけ。いわゆるワンホット制約。 for idx,row in df_puzzle_data.iterrows(): if 'ans_candidate' not
in row: continue candidates = row['ans_candidate'] candidates_len = len(candidates) # if we have no candidate words , skip if candidates_len == 0: continue tmp_H1 = 0 for i in range(candidates_len): x[(row['id'],row['axis'],i)] = Binary(f"x_{row['id']}_{row['axis']}_{i}") tmp_H1 += x[(row['id'],row['axis'],i)] H1 += Constraint((tmp_H1-1)*(tmp_H1-1), label = f"one answer for id,axis = ({row['id']},{row['axis']})")

定式化② GPT4の解答をくみあわせて、文字が交わる部分が１）異なる文字の場合、ペナルティ２）正解の場合、GPT4の解答頻度（確からしさ）に応じてスコア for accross_data in ACROSS_DATA:
# AI could not find candidate words, skip accross_id = accross_data['id'] accross_candidates = list(accross_data['ans_candidate'].keys()) accross_candidates_cnt = len(accross_candidates) if accross_candidates_cnt == 0: continue tmp_H2 = 0 no_const_flag = True for crossing_word in accross_data['crossing_words']: across_loc = crossing_word[0] down_id = crossing_word[1] down_loc = crossing_word[2] down_data = df_down_data[df_down_data["id"] == down_id] down_candidates = list(down_data.iloc[0]['ans_candidate'].keys()) down_candidates_cnt = len(down_candidates) if down_candidates_cnt == 0: continue #縦横の全組合せをチェック、文字が同じ場合はペナルティなし for i,j in product(range(accross_candidates_cnt),range(down_candidates_cnt)): if accross_candidates[i][across_loc-1] != down_candidates[j][down_loc-1]: tmp_H2 += x[(accross_id,AXIS_ACROSS,i)]*x[(down_id,AXIS_DOWN,j)] no_const_flag = False else: accross_key = accross_candidates[i] down_key = down_candidates[j] accross_val = accross_data['ans_candidate'][accross_key] down_val = down_data.iloc[0]['ans_candidate'][down_key] score = int(accross_val)+int(down_val) tmp_H2 -= x[(accross_id,AXIS_ACROSS,i)]*x[(down_id,AXIS_DOWN,j)]*score if no_const_flag: continue tmp_H2 = tmp_H2*(len(accross_data['crossing_words']) - 0.5) H2 += Constraint(tmp_H2,f"Const accross word error {accross_id}") H = Placeholder("OneHot")*H1 + Placeholder("WORDPENALTY")*H2

実際に実行してみるかなり惜しいところまで GPT４問い合わせ＆最適化 1回目 GPT４問い合わせ＆最適化 1回目 GPT４問い合わせ＆最適化 2回目正解重ね合わせが発生！
(違います) 解候補に正解がない。プロンプトの改良が必要

D-Waveの解のばらつき具合も悪くない QPU_SAMPLING_TIME 72.580 ms

お高いんでしょ？高いかどうかは人によりますが、それほどでもないです。 OpenAIのGPT費用は100円程度 D-WaveもLeapのお試し枠で十分

まとめ D-Waveと相性の良い問題であった。理由１．疎結合なため、量子ビットが無駄にならない理由２．なんとなく正解でも答えが出るので人間に優しい　　　　→線形計画では工夫しないとSoftConstっぽいのができないので

その他色んなことしたいのでお金やガジェット有り余っている方回して下さい！ • 予算がありあまっている方 • ガジェットを眠らせている方 AR/VR、ドローン、GPU、ノートPC、タブレット、他

クロスワードを GPT4と量子コンピュータに解かせよう

クロスワードを GPT4と量子コンピュータに解かせよう

Monta Yashi

More Decks by Monta Yashi

Other Decks in Research

Featured

Transcript

そうだ、クロスワードを GPT4＆量子コンピュータに解かせよう 2024年1月28日 monta

改めてクロスワードどう解いてる？

クロスワード「カギ」と呼ばれる文章によるヒントを元に、タテヨコに交差したマスに言葉を当てはめてすべての白マスを埋めるパズル。 2 3 4 5 6 7

クロスワード「カギ」と呼ばれる文章によるヒントを元に、タテヨコに交差したマスに言葉を当てはめてすべての白マスを埋めるパズル。 2 3 4 5 6 7

クロスワード「カギ」と呼ばれる文章によるヒントを元に、タテヨコに交差したマスに言葉を当てはめてすべての白マスを埋めるパズル。 2 3 4 5 6 7

クロスワード「カギ」と呼ばれる文章によるヒントを元に、タテヨコに交差したマスに言葉を当てはめてすべての白マスを埋めるパズル。 2 3 4 5 6 7

クロスワード「カギ」と呼ばれる文章によるヒントを元に、タテヨコに交差したマスに言葉を当てはめてすべての白マスを埋めるパズル。 2 3 4 5 6 7

クロスワード「カギ」と呼ばれる文章によるヒントを元に、タテヨコに交差したマスに言葉を当てはめてすべての白マスを埋めるパズル。 2 3 4 5 6 7

人だけが楽しめる知的な娯楽でした

そう、AIが賢くなるまでは

答えの候補 • 1．カニ、カイ : めんどくさいことはAIにやらせようカギを投げて、解答の候補を生成するなんかイイ感じにする

あとはイイ感じに組合せるだけ

組合せ？

組合せでイイ感じといえば... D-Wave！

lexisrexのクロスワード以下の理由により、英語のクロスワードでチャレンジ・GPT4が英語が得意・日本語は自分が解けるし... https://www.lexisrex.com/English-Crossword-Level-3&id2=2328 問題元：

問題をデータ化現時点ではここは人間。 OpenCV使ったら出来そうだったが、今のところメインの興味範囲でないので保留。

作った依頼文をGPT４に丸投げほぼ、GPTのAPIサンプルのまま client = OpenAI() return_text = "" for

データを構造化複数回と合わせたときに同じ単語を回答した場合は確度が高いと判断する。そのための出現頻度を押さえておく。 GPT4からの解答回数でdict化

定式化① 選ばれる答えは一つだけ。いわゆるワンホット制約。 for idx,row in df_puzzle_data.iterrows(): if 'ans_candidate' not

定式化② GPT4の解答をくみあわせて、文字が交わる部分が１）異なる文字の場合、ペナルティ２）正解の場合、GPT4の解答頻度（確からしさ）に応じてスコア for accross_data in ACROSS_DATA:

実際に実行してみるかなり惜しいところまで GPT４問い合わせ＆最適化 1回目 GPT４問い合わせ＆最適化 1回目 GPT４問い合わせ＆最適化 2回目正解重ね合わせが発生！

D-Waveの解のばらつき具合も悪くない QPU_SAMPLING_TIME 72.580 ms

お高いんでしょ？高いかどうかは人によりますが、それほどでもないです。 OpenAIのGPT費用は100円程度 D-WaveもLeapのお試し枠で十分

まとめ D-Waveと相性の良い問題であった。理由１．疎結合なため、量子ビットが無駄にならない理由２．なんとなく正解でも答えが出るので人間に優しい　　　　→線形計画では工夫しないとSoftConstっぽいのができないので

その他色んなことしたいのでお金やガジェット有り余っている方回して下さい！ • 予算がありあまっている方 • ガジェットを眠らせている方 AR/VR、ドローン、GPU、ノートPC、タブレット、他