Upgrade to Pro — share decks privately, control downloads, hide ads and more …

OpenAI Education Forum 資料「教育と生成AI ~事例から見えるこれからの...

OpenAI Education Forum 資料「教育と生成AI ~事例から見えるこれからの活用~」

2025年3月17日に実施された OpenAI Education Forum にて用いた吉田の講演資料です。
イベントページ: https://events.openai.com/openaieducationforumtokyo

Lui Yoshida

March 17, 2025
Tweet

More Decks by Lui Yoshida

Other Decks in Education

Transcript

  1. 1 • 東京大学 大学院工学系研究科 准教授 • 専門は教育工学(アクティブラーニング、生成AI、 オンライン学習、ファカルティ・ディベロップメント) • コロナ禍における教育のオンライン化支援の貢献が認められ、

    オンライン授業等におけるグッドプラクティス総長表彰 • 研究室で開発した意見交換ツール「LearnWiz One」が世界最大 の EdTech コンペ GESAwards 2021 R&D 部門で世界大会優勝 • 東京財団政策研究所 主席研究員 • 2024年度研究プログラム 「学び続ける教員を支える生成AIに関する学びの場づくり」 • 生成 AI との関わり • コロナ禍のように教員が困るだろうと感じ、できるだけサポートしたいと思い活動 • 2023年5月13日実施の4時間の教員向け講座は参加者が650名以上、最高評価が8割以上、 公開している動画は再生数が8.5万回以上。2025年3月2日に更新版を実施。 @luiyoshida
  2. 2 公開講座 講演 官公庁 ポータルサイト コミュニティ 研究 - 大規模公開講座 (2023年5月23日、2025年3月2日)

    - 毎月末 オンラインイベント - 文部科学省、国会図書館、教育委員会、学校関係団体、学校、企業など計60件以上 - 文部科学省「初等中等教育段階における生成 AI の 利活用に関する検討会議」委員 - 文部科学省「G7 教育イニシアティブ・シンポジウム」講演者・コーディネーター - 経済産業省 令和 6 年度 学びと社会の在り方改革推進事業 メンター - 生成AIのエッセイ評価能力検証(教育AI国際トップ会議 AIED 2024 に論文採択。他4報投稿中) - 生成AIの多言語能力評価 - 「教育現場の生成AIなんでも相談所」運営(テキスト情報共有・月1ミーティング) - 教育×生成AI ポータルサイト Manabi AI(まなびあい)運営
  3. 3 • 学習者による活用例 • 個別学習支援: 個別指導、個別教材・問題作成、 メンター・相談相手としてのコメント・フィー ドバック作成、ドラフト作成 • グループ学習支援:

    チームメンバー、ファシリ テーター、メンターとしてのコメント・フィー ドバック作成 • 課外活動支援: 部活動、学園祭運営支援 • 教職員による活用例 • 授業支援: 授業案作成、教材作成、問題・課題 作成、評価補助 • 校務・事務支援: 資料・報告書作成補助、 データ処理補助 • 研究支援: 英訳、フィードバック生成 https://www.khanmigo.ai/
  4. 4 • 出力が不正確な場合がある(幻覚: ハルシネーション) • 不正に用いられる可能性がある(検出が困難、評価の妥当性が低くなり得る) • バイアス・毒性が存在する (Zhuo et

    al. 2024, Deshpande et al. 2023) • バイアス: 性別、人種、宗教などに関する偏見や先入観 • 毒性: 有害・攻撃的なコンテンツを生成する能力 • 言語格差が存在する • 意図せずデータが学習される可能性がある • 個人情報の捏造、流出の可能性がある • 機密情報の流出の可能性がある • 著作権を侵害する可能性がある • 公平性が保てない可能性がある(有料版と無料版の性能差など)
  5. 5 • 学年・科目: 小学6年生・国語 俳句 • 内容:生成AIが「秋」をテーマに出力した俳句を批判的に検討した後、小学生 がそれぞれ俳句を作成し、最後に画像生成AIを用いて俳句の挿絵を出力する • 実際:生成AIの詩人としての能力の限界への気づき(2つの季語、直接的な表

    現、リズムの悪さ)、自分なりの俳句の工夫 • 生成AIが出力した俳句 「紅葉舞う 秋風さらさら 心落ちつ」 • 感想: 「AI で画像生成するのはとても便利 であるが、間違った使い方をすると自分の 学びにとってよくないかもしれないから 気を付けて使いたい。」 「今後も授業で生成 AI を使ってさらに理解 を深めていけるのではないかと思った。」 出典: https://leadingdxschool.mext.go.jp/report/?pid=633&rid=1614#block-1614
  6. 7 • ハーバード大学の CS 導入コース CS50 で専用ツールを導入 • Explain Highlighted

    Code (コードスニペットの説明など)、 style50 (コードスタイルの評価など)、CS50 Duck (GPT-4 を利用したCS関連ト ピックに関するチャット応答、ディスカッションフォーラムの質問への回答など) • 参加者: 2023年夏 キャンパスで約70人、2023年夏~秋 オンラインで数千人、 2023年秋 キャンパスで学生約500人、2023年6月~12月 全世界で5万人以上 • 評価: 2023年夏 非匿名アンケートで、回答はほぼ完全にポジティブで、学生はツール の有用性、効果、信頼性を高く評価 • 評価: 2023年秋 非匿名アンケートで、 学期中と学期末に2回実施。下記は学期末の結果概要 • 50%が「頻繁に」使用、28%が「常に」使用 • 55%が「頻繁に役立つ」 、33%が「常に役立つ」 • 33%が「好き」 、53%が「愛してる」 • 正確性: 質問に対して AI が正しく答えていたのは、 内容関連: 22/25 (88%)、運営関連 30/39 (77%)
  7. 8 • 分野によって性能が異なる(Lo 2023) • ChatGPT (GPT-3.5) のパフォーマンスについて • 批判的思考・高次思考、経済学、プログラミング、英文解釈で高評価

    • 法学、医学教育、数学、スポーツ科学と心理学などでは低評価 • モデルによって性能が異なる(OpenAI 2023) • GPT-3.5は米司法試験において下位10%のスコア • GPT-4 は米司法試験において上位10%のスコア • マイナーバージョンによっても性能が異なる・最新のモデルが必ずしも性能 が高いわけではない(Yoshida 2024) • マイナーバージョンによってエッセイ評価能力が異なる (補足: GPT-3.5 や GPT-4 の中でもさらに細かくバージョンが分かれている) • 最新モデルではないモデルが最高性能を示す
  8. 9 • 利用時期によって性能が異なる(Chen et al. 2023) • 数学的推論について • GPT-3.5(2023年3月)<

    GPT-3.5(2023年6月) • GPT-4 (2023年3月)> GPT-4 (2023年6月) • 使い方や評価方法によって影響が異なる(Brender. J, et al. 2024) • スイスの大学院におけるロボット工学コースにおける実験結果
  9. 11 • 評価の妥当性を下げ得る • 筆記に関連する学習成果物を自動生成させられると評価が揺らぐ (誤りが含まれることもあり、必ずしもそのまま使えるわけではない) • 評価方法、波及的に授業目的や内容、カリキュラムを再検討する可能性も • 対策として、対面評価、生成AIが成果物を自動生成しにくい課題設定など

    • 学習プロセスを支援し得る • 例)家庭教師、相談相手、チームメイトなどの役割を与えて活用する • 教員の授業作りや校務・事務を支援し得る • 例)授業案、問題、教材、資料などのドラフトを作成してもらう 本質的には、生成 AI で楽したいと思われるような授業・課題ではなく、 もっと自分で学びたい、自分で取り組みたいと思ってもらえるような 授業・課題作りが重要だと吉田は思っています
  10. 13 • Brender, J., El-Hamamsy, L., Mondada, F., & Bumbacher,

    E. (2024, July). Who’s Helping Who? When Students Use ChatGPT to Engage in Practice Lab Sessions. In International Conference on Artificial Intelligence in Education (pp. 235-249). Cham: Springer Nature Switzerland. • Chen, L., Zaharia, M., & Zou, J. (2024). How is ChatGPT’s behavior changing over time?. Harvard Data Science Review, 6(2). • Deshpande, A., Murahari, V., Rajpurohit, T., Kalyan, A., & Narasimhan, K. (2023). Toxicity in chatgpt: Analyzing persona-assigned language models. arXiv preprint arXiv:2304.05335. • Liu, R., Zenke, C., Liu, C., Holmes, A., Thornton, P., & Malan, D. J. (2024, March). Teaching CS50 with AI: leveraging generative artificial intelligence in computer science education. In Proceedings of the 55th ACM technical symposium on computer science education V. 1 (pp. 750-756). • Lo, C. K. (2023). What is the impact of ChatGPT on education? A rapid review of the literature. Education sciences, 13(4), 410. • OpenAI (2023). GPT-4 technical report. arXiv preprint arXiv:2303.08774. • Yoshida, L. (2024, July). The Impact of Example Selection in Few-Shot Prompting on Automated Essay Scoring Using GPT Models. In International Conference on Artificial Intelligence in Education (pp. 61-73). Cham: Springer Nature Switzerland. • Zhou, M., Abhishek, V., Derdenger, T., Kim, J., & Srinivasan, K. (2024). Bias in generative AI. arXiv preprint arXiv:2403.02726.