OpenAI Education Forum 資料「教育と生成AI ～事例から見えるこれからの活用～」

1 • 東京大学大学院工学系研究科准教授 • 専門は教育工学（アクティブラーニング、生成AI、オンライン学習、ファカルティ・ディベロップメント） • コロナ禍における教育のオンライン化支援の貢献が認められ、
オンライン授業等におけるグッドプラクティス総長表彰 • 研究室で開発した意見交換ツール「LearnWiz One」が世界最大の EdTech コンペ GESAwards 2021 R&D 部門で世界大会優勝 • 東京財団政策研究所主席研究員 • 2024年度研究プログラム「学び続ける教員を支える生成AIに関する学びの場づくり」 • 生成 AI との関わり • コロナ禍のように教員が困るだろうと感じ、できるだけサポートしたいと思い活動 • 2023年5月13日実施の4時間の教員向け講座は参加者が650名以上、最高評価が8割以上、公開している動画は再生数が8.5万回以上。2025年3月2日に更新版を実施。 @luiyoshida

2 公開講座講演官公庁ポータルサイトコミュニティ研究 - 大規模公開講座 (2023年5月23日、2025年3月2日)
- 毎月末オンラインイベント - 文部科学省、国会図書館、教育委員会、学校関係団体、学校、企業など計60件以上 - 文部科学省「初等中等教育段階における生成 AI の利活用に関する検討会議」委員 - 文部科学省「G7 教育イニシアティブ・シンポジウム」講演者・コーディネーター - 経済産業省令和 6 年度学びと社会の在り方改革推進事業メンター - 生成AIのエッセイ評価能力検証（教育AI国際トップ会議 AIED 2024 に論文採択。他4報投稿中） - 生成AIの多言語能力評価 - 「教育現場の生成AIなんでも相談所」運営（テキスト情報共有・月1ミーティング） - 教育×生成AI ポータルサイト Manabi AI（まなびあい）運営

3 • 学習者による活用例 • 個別学習支援: 個別指導、個別教材・問題作成、メンター・相談相手としてのコメント・フィードバック作成、ドラフト作成 • グループ学習支援:
チームメンバー、ファシリテーター、メンターとしてのコメント・フィードバック作成 • 課外活動支援: 部活動、学園祭運営支援 • 教職員による活用例 • 授業支援: 授業案作成、教材作成、問題・課題作成、評価補助 • 校務・事務支援: 資料・報告書作成補助、データ処理補助 • 研究支援: 英訳、フィードバック生成 https://www.khanmigo.ai/

4 • 出力が不正確な場合がある（幻覚: ハルシネーション） • 不正に用いられる可能性がある（検出が困難、評価の妥当性が低くなり得る） • バイアス・毒性が存在する (Zhuo et
al. 2024, Deshpande et al. 2023) • バイアス: 性別、人種、宗教などに関する偏見や先入観 • 毒性: 有害・攻撃的なコンテンツを生成する能力 • 言語格差が存在する • 意図せずデータが学習される可能性がある • 個人情報の捏造、流出の可能性がある • 機密情報の流出の可能性がある • 著作権を侵害する可能性がある • 公平性が保てない可能性がある（有料版と無料版の性能差など）

5 • 学年・科目: 小学6年生・国語俳句 • 内容：生成AIが「秋」をテーマに出力した俳句を批判的に検討した後、小学生がそれぞれ俳句を作成し、最後に画像生成AIを用いて俳句の挿絵を出力する • 実際：生成AIの詩人としての能力の限界への気づき（2つの季語、直接的な表
現、リズムの悪さ）、自分なりの俳句の工夫 • 生成AIが出力した俳句「紅葉舞う秋風さらさら心落ちつ」 • 感想: 「AI で画像生成するのはとても便利であるが、間違った使い方をすると自分の学びにとってよくないかもしれないから気を付けて使いたい。」「今後も授業で生成 AI を使ってさらに理解を深めていけるのではないかと思った。」出典: https://leadingdxschool.mext.go.jp/report/?pid=633&rid=1614#block-1614

6 出典: https://www.mext.go.jp/content/20240725-mxt_jogai01-000037149_21.pdf

7 • ハーバード大学の CS 導入コース CS50 で専用ツールを導入 • Explain Highlighted
Code (コードスニペットの説明など)、 style50 (コードスタイルの評価など)、CS50 Duck (GPT-4 を利用したCS関連トピックに関するチャット応答、ディスカッションフォーラムの質問への回答など) • 参加者: 2023年夏キャンパスで約70人、2023年夏～秋オンラインで数千人、 2023年秋キャンパスで学生約500人、2023年6月～12月全世界で5万人以上 • 評価: 2023年夏非匿名アンケートで、回答はほぼ完全にポジティブで、学生はツールの有用性、効果、信頼性を高く評価 • 評価: 2023年秋非匿名アンケートで、学期中と学期末に2回実施。下記は学期末の結果概要 • 50%が「頻繁に」使用、28%が「常に」使用 • 55%が「頻繁に役立つ」、33%が「常に役立つ」 • 33%が「好き」、53%が「愛してる」 • 正確性: 質問に対して AI が正しく答えていたのは、内容関連: 22/25 (88%)、運営関連 30/39 (77%)

8 • 分野によって性能が異なる（Lo 2023） • ChatGPT (GPT-3.5) のパフォーマンスについて • 批判的思考・高次思考、経済学、プログラミング、英文解釈で高評価
• 法学、医学教育、数学、スポーツ科学と心理学などでは低評価 • モデルによって性能が異なる（OpenAI 2023） • GPT-3.5は米司法試験において下位10%のスコア • GPT-4 は米司法試験において上位10%のスコア • マイナーバージョンによっても性能が異なる・最新のモデルが必ずしも性能が高いわけではない（Yoshida 2024） • マイナーバージョンによってエッセイ評価能力が異なる（補足: GPT-3.5 や GPT-4 の中でもさらに細かくバージョンが分かれている） • 最新モデルではないモデルが最高性能を示す

9 • 利用時期によって性能が異なる（Chen et al. 2023） • 数学的推論について • GPT-3.5（2023年3月）<
GPT-3.5（2023年6月） • GPT-4 （2023年3月）> GPT-4 （2023年6月） • 使い方や評価方法によって影響が異なる（Brender. J, et al. 2024） • スイスの大学院におけるロボット工学コースにおける実験結果

10 • 生成AIが教育へ与える影響は複層的である（分野、モデル、マイナー含むバージョン、使い方、評価方法、プロンプトなどで影響が異なる） • 要約、文章作成、アイデア出し、プログラミング、翻訳など全般的に得意な分野もあるため、その強みを活かす活用法は汎用的になりやすい • 生成AIモデルやサービスの進展スピードを考慮すると今後も臨機応変な対応、課題の収集・知見の蓄積が求められる（臨機応変に対応できる体制づくりが
必要）実際に利用して試行錯誤することが大事技術を取り入れた授業設計・環境整備が重要手段が目的化しないように注意！

11 • 評価の妥当性を下げ得る • 筆記に関連する学習成果物を自動生成させられると評価が揺らぐ（誤りが含まれることもあり、必ずしもそのまま使えるわけではない） • 評価方法、波及的に授業目的や内容、カリキュラムを再検討する可能性も • 対策として、対面評価、生成AIが成果物を自動生成しにくい課題設定など
• 学習プロセスを支援し得る • 例）家庭教師、相談相手、チームメイトなどの役割を与えて活用する • 教員の授業作りや校務・事務を支援し得る • 例）授業案、問題、教材、資料などのドラフトを作成してもらう本質的には、生成 AI で楽したいと思われるような授業・課題ではなく、もっと自分で学びたい、自分で取り組みたいと思ってもらえるような授業・課題作りが重要だと吉田は思っています

12 • まずはご自身で使ってみることをおすすめします • あくまでも AI は技術であり、人間中心に使うことが重要です（人間が責任を持つ、AIは責任を持ってくれない） GPT-4.5 で作成

13 • Brender, J., El-Hamamsy, L., Mondada, F., & Bumbacher,
E. (2024, July). Who’s Helping Who? When Students Use ChatGPT to Engage in Practice Lab Sessions. In International Conference on Artificial Intelligence in Education (pp. 235-249). Cham: Springer Nature Switzerland. • Chen, L., Zaharia, M., & Zou, J. (2024). How is ChatGPT’s behavior changing over time?. Harvard Data Science Review, 6(2). • Deshpande, A., Murahari, V., Rajpurohit, T., Kalyan, A., & Narasimhan, K. (2023). Toxicity in chatgpt: Analyzing persona-assigned language models. arXiv preprint arXiv:2304.05335. • Liu, R., Zenke, C., Liu, C., Holmes, A., Thornton, P., & Malan, D. J. (2024, March). Teaching CS50 with AI: leveraging generative artificial intelligence in computer science education. In Proceedings of the 55th ACM technical symposium on computer science education V. 1 (pp. 750-756). • Lo, C. K. (2023). What is the impact of ChatGPT on education? A rapid review of the literature. Education sciences, 13(4), 410. • OpenAI (2023). GPT-4 technical report. arXiv preprint arXiv:2303.08774. • Yoshida, L. (2024, July). The Impact of Example Selection in Few-Shot Prompting on Automated Essay Scoring Using GPT Models. In International Conference on Artificial Intelligence in Education (pp. 61-73). Cham: Springer Nature Switzerland. • Zhou, M., Abhishek, V., Derdenger, T., Kim, J., & Srinivasan, K. (2024). Bias in generative AI. arXiv preprint arXiv:2403.02726.

OpenAI Education Forum 資料「教育と生成AI ～事例から見えるこれからの...

OpenAI Education Forum 資料「教育と生成AI ～事例から見えるこれからの活用～」

Lui Yoshida

More Decks by Lui Yoshida

Other Decks in Education

Featured

Transcript

1 • 東京大学大学院工学系研究科准教授 • 専門は教育工学（アクティブラーニング、生成AI、オンライン学習、ファカルティ・ディベロップメント） • コロナ禍における教育のオンライン化支援の貢献が認められ、

2 公開講座講演官公庁ポータルサイトコミュニティ研究 - 大規模公開講座 (2023年5月23日、2025年3月2日)

3 • 学習者による活用例 • 個別学習支援: 個別指導、個別教材・問題作成、メンター・相談相手としてのコメント・フィードバック作成、ドラフト作成 • グループ学習支援:

4 • 出力が不正確な場合がある（幻覚: ハルシネーション） • 不正に用いられる可能性がある（検出が困難、評価の妥当性が低くなり得る） • バイアス・毒性が存在する (Zhuo et

6 出典: https://www.mext.go.jp/content/20240725-mxt_jogai01-000037149_21.pdf

7 • ハーバード大学の CS 導入コース CS50 で専用ツールを導入 • Explain Highlighted

8 • 分野によって性能が異なる（Lo 2023） • ChatGPT (GPT-3.5) のパフォーマンスについて • 批判的思考・高次思考、経済学、プログラミング、英文解釈で高評価

9 • 利用時期によって性能が異なる（Chen et al. 2023） • 数学的推論について • GPT-3.5（2023年3月）<

12 • まずはご自身で使ってみることをおすすめします • あくまでも AI は技術であり、人間中心に使うことが重要です（人間が責任を持つ、AIは責任を持ってくれない） GPT-4.5 で作成

13 • Brender, J., El-Hamamsy, L., Mondada, F., & Bumbacher,