Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
200個のGitHubリポジトリを横断調査したかった
Search
Issei.Komori
June 17, 2026
Technology
110
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
200個のGitHubリポジトリを横断調査したかった
クラメソさっぽろIT勉強会 (仮) #14 オススメの Agent Skills
https://classmethod.connpass.com/event/394411/
Issei.Komori
June 17, 2026
More Decks by Issei.Komori
See All by Issei.Komori
mnt_data_とは?ChatGPTコード実行環境を深堀りしてみた
icck
0
1.2k
MCPコードリーディングすると得られるもの
icck
1
160
NL2SQLの世界
icck
0
1.6k
Audio and Video Processing with Generative AI
icck
0
100
Postmanと仲良くなる。API簡易実行にしか使ってなかった初心者の第二歩目
icck
1
220
APIフレームワークを Lambdaで動かす
icck
1
160
Other Decks in Technology
See All in Technology
日本 Fintech 未来予測レポート 2027〜2028年(オリジナル版)
8maki
0
1.5k
AIの性能が向上しても未解決な組織の重大問題は何か?/An Unsolved Organizational Problem in the Age of AI
moriyuya
3
610
価格.comをAI駆動で全面刷新する ー 30年分の技術的負債を返し、次の30年の土台をつくる ー / AI Engineering Summit Tokyo 2026
tkyowa
53
59k
攻撃者視点で考えるDetection Engineering
cryptopeg
0
920
爆速でマルチプロダクトを立ち上げる時 事業・CTO目線で大事にしたい事
miyatakoji
0
100
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
240
AIソロプレナー時代に2ヶ月で20人増員した事業創造会社の開発組織の話
miyatakoji
0
580
白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?
brainpadpr
1
270
LLMと共に進化するプロセスを目指して
ymatsuwitter
12
3.9k
Djangoユーザが知っ得なPostgreSQL機能 - 設計の選択肢を増やす / Djang-use-PostgreSQL
soudai
PRO
1
230
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
210
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
3
2.1k
Featured
See All Featured
Context Engineering - Making Every Token Count
addyosmani
9
960
Building an army of robots
kneath
306
46k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.9k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
160
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
140
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
370
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
330
Raft: Consensus for Rubyists
vanstee
141
7.5k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Transcript
200個のGitHubリポジトリを 横断調査したかった 生活協同組合コープさっぽろ 2026/06/17 小森一成(@icckx) クラメソさっぽろIT勉強会 (仮) #14 〜オススメの Agent
Skills〜
小森 一成(@icckx)
「オススメのAgentSkills」 is 自作Skillsの話 200個のリポジトリを横断調査 したかった 自作Skills gh-repo-profiler やってみて設計で学んだことを共有
作成の背景と目的 Aさん「うちってどんな技術スタックがデファクトなの?」 私「エンジニア内でなんとなく、これっていう共通認識はありますね...」 Aさん「GitHubリポジトリみて調査して」 私「わかりました(AIある時代だし、なんとかなるよね)」
1個ずつ人間が見て回るのは無理。だから横断で 言語 / フレームワーク / パッケージマネージャ / IaC / クラウド…
SBOMじゃ細かすぎ、GitHub CLIだけじゃ情報不足... 1個ずつ、CloneしてAIに調査させる?!だるすぎ...
素朴にAIに聞くと上手くいかない 抜ける(見るべきファイルを探し損ねる) 推測で埋める(ハルシネーション) 出力フォーマットが毎回バラバラ
作ったもの: gh-repo-profiler owner/repo を渡すと、技術選定プロファイルを ~/repo-profiles/<owner>/<repo>.json に出力するSkills 目的は「単発の構成解説」ではなく 横断クエリ可能な判断材料を溜めること 1リポジトリ =
1 JSON、蓄積前提の設計 作り方: /grill-with-docs → /skill-creator
設計の核: 素材取得は「決定的スクリプト」 LLMに「探させる」と抜ける gh CLI + tarball で マニフェスト /
CI / IaC / README を機械的に回収 LLMの仕事は「集める」ではなく 「読んで構造化する」だけ
設計の核: なぜ出力をJSONにしたか スキーマ固定JSONにして出力を安定化 DuckDBがそのまま読める形に、溜めたJSONを横断クエリ可能としておく Skills Skills Skills Skills Skills
溜めた瞬間、問いがSQL1本に DuckDBで一発(ゴールデンSQLはSkillsのReferenceに) JSON, CSV, Parquet なんでもSQLで操作で きちゃうやつ → LLMの集計に 確実性を与える
学び: 200個は「サブエージェント」で捌く /gh-repo-profiler サブエージェントつかって処理して。 Repo1 Repo2 Repo3 … (Repo45までは平行はためした 当時
Opus4.7)
おまけ:レポートはHTMLで DuckDBで集計したものを Pythonでグラフにして、 LLMのの評価とかけ合わせる レポートだとHTMLは MarkDown + Mermaid より 見やすい
レポート用のSkillsが 別途あると便利
まとめ 取得は決定的スクリプト、構造化だけLLM → 抜け・嘘を防ぐ 出力はDuckDB可読のJSON → 出力も後続の入力も安定する 大量実行はサブエージェント → 親の文脈を汚さず200個を捌く
200個のGitHubリポジトリを 横断調査したかった 生活協同組合コープさっぽろ 2026/06/17 小森一成(@icckx) クラメソさっぽろIT勉強会 (仮) #14 〜オススメの Agent
Skills〜