未踏ブースト会議資料

機械学習に基づく中山間地域向け農業用散布ドローン群有⽥朋樹・和⽥唯我

2 自己しょーかい有⽥朋樹 (M1) 慶應義塾⼤学理⼯学部 SD ドローン，マルチエージェント制御和⽥唯我 (M2)
慶應義塾⼤学理⼯学部情報⼯学機械学習，画像認識, ロボティクス

3 自己しょーかい有⽥朋樹 (M1) 慶應義塾⼤学理⼯学部 SD ドローン，マルチエージェント制御和⽥唯我 (M2)
慶應義塾⼤学理⼯学部情報機械学習，画像認識福島県⼤熊町を復興するため，かつての特産品だったキウイの栽培を始めた → ドローン × AI でキウイの受粉作業を⾃動化できないか？

虫ばい人手(大体これ) 接触感染する病気(かいよう病など)への理解 → 徐々に吹き付け受粉へと変化導⼊コストが⼤きく，野外では不可能な場合も多い開花時期が不確定かつ短期間→ ⼈⼿を雇⽤するのが困難 →
中⼭間地帯においては過酷な労働となるため⼈⼿が存在しないキウイの受粉はひじょーに大変！！ 4

5 キウイの受粉はひじょーに大変！！受粉きつすぎ問題月別投下労働時間せん定： 60時間受粉： 40時間防除： 14時間
収かく： 35時間（１アールあたり）

6 受粉可能な期間は限られ短期間のみ(満開は3~5⽇)の⼤量の雇⽤が発⽣する受粉という単⼀の作業のために，果樹栽培全体のハードルが上昇震災前は地元のおばちゃんたちをパートで取って，地域で助け合っていた震災後⻑期の避難指⽰で地域コミュニティは喪失⼈⼝もまだ⾮常に少なくパートで取るのは難しい農家の声

7 現状のソリューションと小型ドローンの可能性⾃動⾛⾏型アームロボット⼤型散布ドローン室内受粉ドローン (⽇本⼯業⼤学) 整備されたハウス内でモーションキャプチャを⽤いることを前提
積載効率不整地における機動性狭路(果樹棚下など) における機動性 Excellent 👍 Poor Good Very Poor 👎 Poor Good Poor Good ? Very Poor 👎

室内受粉ドローン (⽇本⼯業⼤学) 現状のソリューションと小型ドローンの可能性 8 ⾃動⾛⾏型アームロボット⼤型散布ドローン整備されたハウス内でモーションキャプチャを⽤いることを前提
積載効率不整地における機動性狭路(果樹棚下など) における機動性 Excellent 👍 Poor Good Very Poor 👎 Poor Good Poor Good ? Very Poor 👎 ⾃動⾛⾏型アームロボット https://scienceportal.jst.go.jp/gateway/clip/20230728_g01/ ・安定したビニールハウス・⼤型カメラによるドローンの位置推定 → 完全に整備された環境

9 現状のソリューションと小型ドローンの可能性⾃動⾛⾏型アームロボット⼤型散布ドローン室内受粉ドローン (⽇本⼯業⼤学) 整備されたハウス内でモーションキャプチャを⽤いることを前提
積載効率不整地における機動性狭路(果樹棚下など) における機動性 Excellent 👍 Poor Good Very Poor 👎 Poor Good Poor Good ? Very Poor 👎 Agriswarm Fair Excellent 👍 Excellent 👍

10 本PJで何をやるか：ドローン群 X 機械学習２.近づく（MAPF） Multiagent path finding
4.受粉 (電動吹付) Shoot!! 1.飛ぶ（SLAM） Simultaneous localization and mapping 緑：制御⼯学による制御⻘：機械学習による認知 3.花の向きは？（HPE） Head pose estimation

11 本PJで何をやるか：ドローン群 X 機械学習２.近づく（MAPF） Multiagent path finding
4.受粉 (電動吹付) Shoot!! 1.飛ぶ（SLAM） Simultaneous localization and mapping 緑：制御⼯学による制御⻘：機械学習による認知 3.花の向きは？（HPE） Head pose estimation

12 5. 受粉タイムアタック（Coverage Control） Starlink WiFi ルータ実証フィールド: 福島県⼤熊町にあるキウイの國
(⾃称, 2.5haの借地) 本PJで何をやるか：ドローン群 X 機械学習 ※ Starlinkなどの通信環境は整備済み

13 しんちょく：実機の開発を開始！！重さ： 311g 飛行時間(推定)：１０分弱 FCU: Kakute H7
Mini 計算資源： Jetson Xavier NX 受粉機構：かいはつちゅー名前：だっきー(仮)

14 〜電装ぱーと〜物理そう&通信

15 〜機構ぱーと〜コンプレッサーを元に受粉機構を開発中電動きり吹き分解コンプレッサー必要最小限のモータトルクを計算して試行さくご中...

16 〜制御ぱーと〜だっきー(仮)の群制御技術制御環境地図を仲間で共有して協調しながら SLAMを⾏う仲間にぶつからないように移動経路を計画する
Multi Agent Path Finding Multi Agent SLAM

Multi Agent Path Finding Multi Agent SLAM (Simultaneous Localization and
Mapping) [Zhou+, Science Robotics22] によって障害物×不整地のドローン⾶⾏が初めて実現 → 当該環境におけるドローンの社会応⽤は難易度が⾼い！ ROS上でのマルチエージェント経路計画のシミュレーション〜制御ぱーと〜だっきー(仮)の群制御技術

18 花の姿勢推定: 花粉を適切に散布するには花の姿勢情報が重要⼈間の頭部の向きを推定するHead Pose Estimationから着想を得て，花の姿勢 (オイラー⾓)を推定 → TokenHPE
[Zhang+, CVPR23]をベースに花の物体検出デファクトスタンダードのモデル (e.g., YOLO) により物体検出を実⾏〜機械学習ぱーと〜花粉を適切に散布するために花の姿勢を推定

19 姿勢推定モデルの汎化には⼤量のデータが必要 → ⾮常に⾼コストな作業花が 𝑵 輪，撮影⾓度が 𝑴 個必要だとする． 𝑴
個の⾓度から花の写真を撮影 (𝑵 × 𝑴 回) 𝑵 枚全ての花の写真に対して，姿勢をアノテーション(𝑵 × 𝑴 回) > 𝑵 × 𝑴 =10万も⼈間がアノテーションするの？？効率的なアノテーション収集がひつよう！！ ① N = 3 M = 4 ② ④ ⑤ ⑫ ⑥ ⑦ ⑧ ⑨ ⑩ ⑪ ③

〜機械学習ぱーと〜 20 機械学習のフロー花の動画を撮る 3D上でアノテーション姿勢推定モデルを学習はたけで推論 NeRF/Gaussian Splatting
により花の3Dモデルを作成 → アノテーションコストを20分の1に削減⼈間の頭部の向きを推定するHPE技術を元に花の姿勢 (オイラー⾓)を学習 YOLOv8で花検出 HPEで姿勢推論三次元空間上でたった⼀回だけアノテーション

〜機械学習ぱーと〜 21 花の動画を撮る 3D上でアノテーション姿勢推定モデルを学習はたけで推論 NeRF/Gaussian Splatting により花の3Dモデルを作成
→ アノテーションコストを20分の1に削減⼈間の頭部の向きを推定するHPE技術を元に花の姿勢 (オイラー⾓)を学習 YOLOv8で花検出 HPEで姿勢推論機械学習のフロー

22 受粉機構の制作吹付機構は受粉に限らず広く存在するため従来の機構を電気制御可能に改造することで実現可能であると考えられるが，ドローンの⾶⾏可能推⼒との兼ね合いについては未確定→ 前例のある筆などでの接触受粉機構をプランBとして⾒据えるべき上位プランナのシステム設計 1. 広域における花の識別管理既に受粉した花の識別などのために，広域における花の管理システムが必要．開放環
境では推定した花の位置の不確定性が⾼いため，どのようにシステムを設計するかが課題である．→ GPSを⽤いて⼤域の位置管理を⾏うことや，散布する受粉溶液に⾊をつけるなど，局所における問題解決に緩和することも視野に⼊れている． 2. ⾶⾏可能時間のマネジメント現時点でのドローンの⾶⾏時間は約10分ほどであると想定されるため，バッテリーの残量を考慮した上位プランナの設計が必要である．現状の課題

23 SLAM on だっきー（仮）しんちょく： SLAM / 3Dモデル / 飛行
キウイと3Dモデル

25 SLAM on だっきー（仮）だっきー（仮）の飛行しんちょく： SLAM / 3Dモデル /
飛行

26 本PJが目指す未来！！新たな農業風景一体化(共変形) のプロセスドローンによってキウイが変形するキウイによってドローンが変形するキウイポテンシャル
ドローン群ポテンシャル

27 本PJが目指す未来！！小型ドローン群を農業風景と一体化させる

Appendix

機械学習に基づく中⼭間地域向け農業⽤散布ドローン群有⽥朋樹・和⽥唯我

原発被災の中⼼都市である⼤熊町を復興するため，かつて特産品だったキウイの栽培を始めた

⽇本全体，特に中⼭間地域における農業を取り巻く厳しい現実を知る ※中⼭間地域：斜⾯が多く地理的条件が悪いため、農業の⽣産条件が不利な地域

⽇本における中⼭間地域の割合 38% 耕地⾯積 44% 総農家数 40% 農業産出額 92% 60歳以上の就業者割合
※⺟数は⽇本国内の農業経営体および研究団体 ※農研機構資料より https://shingi.jst.go.jp/pdf/2021/2021_jst-3_003.pdf 機械化の必要性

5% 作業プロセスの機械化 1% 中⼭間地域における機械化の遅れ&我々がやるべきこと ※⺟数は⽇本国内の農業法⼈経営体および研究団体中⼭間地域・不整地受粉作業の機械化
5~10例 ※独⾃調べ全体 (整備環境) ※農研機構スマート推進フォーラム資料 https://www.maff.go.jp/kinki/seisan/s mart/event/attach/pdf/smart_2023- 5.pdf ? ≫

Vision 不整地の農作業をドローン×AIで代替し，⽇本初の中⼭間地域の機械化を実現する果樹農業における主な⼯程畑の耕起・整地苗植え摘蕾・摘果・防除受粉
収穫

未踏におけるMission 不整地果樹棚下における受粉作業をドローン×AIで代替する果樹農業における主な⼯程畑の耕起・整地苗植え摘蕾・摘果・防除受粉
収穫果樹棚下の例未踏におけるターゲット

Sensing Approach & 受粉 Flower Detection & Pose Estimation 概要:
Agriswarmの受粉技術

詳細: 受粉における群制御技術 Multi Agent Path Finding Multi Agent SLAM (Simultaneous
Localization and Mapping) Agriswarm [Zhou+, Science Robotics 2022] によって障害物×不整地のドローン⾶⾏が初めて実現 → 当該環境におけるドローンの社会応⽤は未踏性が⾼い ROS上でのマルチエージェント経路計画のシミュレーション

Flower Detection & Pose Estimation 詳細: 花認識における機械学習技術 • 花の姿勢推定: 花粉を適切に散布するには花の姿勢情報が重要
• ⼈間の頭部の向きを推定するHead Pose Estimationから着想を得て，花の姿勢 (オイラー⾓)を推定 → TokenHPE [Zhang+, CVPR23]をベースに • 花の物体検出 • デファクトスタンダードのモデル (e.g., YOLO) により物体検出を実⾏ TokenHPE [Zhang+, CVPR23]

• 姿勢推定モデルの汎化には⼤量のデータが必要 → ⾮常に⾼コストな作業 • 花が 𝑵 輪，撮影⾓度が 𝑴 個必要だとする．
• 𝑴 個の⾓度から花の写真を撮影 (𝑵 × 𝑴 回) • 𝑵 枚全ての花の写真に対して，姿勢をアノテーション(𝑵 × 𝑴 回) > 𝑵 × 𝑴 =10万も⼈間がアノテーションするの？？ Q. 花のアノテーションを効率的に収集するには？ ① N = 3 M = 4 ② ④ ⑤ ⑫ ⑥ ⑦ ⑧ ⑨ ⑩ ⑪ ③ 詳細: 花認識における機械学習技術

Flower Detection & Pose Estimation Q. 花のアノテーションを効率的に収集するには？ A. 花の動画を撮影し，動画から3Dモデルを作成 (NeRF)
→三次元空間上でたった⼀回だけアノテーション • 𝑵 × 𝑴 → 𝑵 回にまで⼯数を削減 • 𝑵回のアノテーションで， 𝑵 × 𝑴 枚のGTを取得 ① ② ③ N = 3 M = 4 詳細: 花認識における機械学習技術

現時点の進捗ドローンのシミュレーション環境を開発ドローンの実機制御システムを開発⾃⼰位置推定，経路計画，花の状態推定，etc. Gazebo上で，SITL(Software in the Loop)環境を構築．各制御モジュール,
プランナの検証が可能ドローンの実機(プロトタイプ)を実装・実地検証花認識システムを構築(モデル &アノテーションツール)

現時点までに実装したソースコードは全てgithubで公開している． https://github.com/AgriSwarm 現時点の進捗

担当:有⽥システム構成＆役割分担上位プランナ

50% 80% 80% 80% 改良した実機を製作受粉機構と制御システムの開発上位プランナの開発未着⼿
未着⼿対象の花に対する⾼い汎化性能が必要 →改善の余地圃場全体における花の管理・⾏動計画未着⼿システム構成＆役割分担機械学習システム統合ドローン群制御実機実装有⽥和⽥

Agriswarmの展望未踏プロジェクト開始未踏プロジェクト終了受粉に限らない汎⽤型の中⼭間地域向けドローンとして改良中⼭間地域向け農業ソリューションとしてビジネス展開 2024/6
2025/2 3年後の果樹数：500本想定される花の数：10,000本耕地⾯積：2.8ha 導⼊確定農園(実証フィールド) その他協⼒農園(⾒込) : 2 福島県⼤熊町キウイ農園 (東京ドームの半分以上)

キウイの國圃場に関する主なメトリクス 1反（10a）キウイ16本 25反(10年計画) せん定： 60時間受粉： 40時間防除： 14時間
収かく： 35時間約3トン（2万個）のキウイを 100円/個で売るキウイの国受粉：～1000時間 5千万円 (内費用2千万)

WiFi環境(実証フィールド) ⾮WiFi環境想定する通信⽅式 Peer to peer ad-hoc network , PCIe
Starlink アンテナ WiFi ルータサーバ機プロトタイプ Linux Laptop 画像伝送システム, 2.4Ghz帯無線

想定するビジネス展開と収益性約200万円農業⽤⼤型ドローン Agriswarm ~20万円 Agriswarm10台で⼤型ドローン1台の性能を上回れば収益性有り価格整地環境
における収益性不整地環境における収益性受粉ドローン受粉需要は特定の時期に集中するため，買い切りではなくレンタルでの展開を想定汎⽤農業ドローン年間需要に対応できるようになった段階で買い切り⽤の製品化を⽬指す ※現在の⼤型ドローンの多くは不整地で適⽤できないため

Agriswarmの展望 9% 8,450億円国内農業算出額に占める果樹の割合 https://www.maff.go.jp/j/cou ncil/seisaku/kazyu/r01_1_kajy u/attach/pdf/index-19.pdf 全体 92,742億円
⼭間農業地域, 9,441ha 中間農業地域, 48,555ha 都市的地域, 22,929ha 平地農業地域, 53,950ha 果樹全体に占める中⼭間地域の割合 https://www.maff.go.jp/kanto/seisan/ engei/kaju/attach/pdf/190709-4.pdf 本プロジェクトが持つ潜在経済規模 (全作業の1%を代替できた場合) 受粉の代替農作業全体の代替 3,718億円 > 37億円

Nvidia Xavier NX Realsense d435 Holybro Pixhawk 4 Hardware Main
Processer Flight Controller Unit Sensor/Camera Software Ardupilot フライトコントローラ⾃⼰位置推定 VINS-Mono (Visual Inertial Odometry) Protype Crazyflie 2.1 経路計画 EGO-Planner (Multi Agent Path Finding) 画像認識 NeRF(3d Reconstruction) & HPE(Pose Estimation)

姿勢推定モデルの学習に必要なデータセット数 • ⼀般的なHead Pose Estimation (HPE) • 300W-LP consists of
66,225 face samples collected from multiple databases that are further enhanced to 122,450 samples by image flipping. It is based on around 4000 real images. The ground truth is provided in the Euler angle format. For training, we convert them into the matrix form. • → ⼀般的なHPEにおいては12万枚の画像を要する • 今回の系においてはどうか？ • 「⼈間の顔写真」という複雑性の⾼い⼊⼒と⽐較して，「花の画像」の複雑性は低い • → 汎化させるのに10万枚の画像はtoo muchだと思われる • しかし，実際に学習させてみないと分からないというのが実情

アノテーションツールによって期待される削減⼯数の期待値 • 前⾴より，今回の系において 1,000枚程度のGround Truthが必要だと仮定 • 1 instance (1輪)で学習に使える画像が10枚取れるとすると，100 instance
あれば，1,000枚のGTが取得可能 • 逆に何instanceあれば汎化するのか？ • 経験則的に，⼀つの花の種類に 50 instance程度だと推測 • 1instanceにつき 1,000 / 50 = 20枚取る • 我々のソリューションだと 50回のアノテーション • ⼀般的な⽅法論であれば1,000回のアノテーション • → 20倍ものアノテーション数削減が⾒込める • → プロジェクトを円滑に進める上で必要不可⽋

キウイに対する熱意

未踏ブースト会議資料

未踏ブースト会議資料

More Decks by Yuiga Wada (和田唯我)

Other Decks in Technology

Featured

Transcript