社内のCV輪講で使用した資料です。
LLMDet: Learning Strong Open-Vocabulary Object Detectors under the Supervision of Large Language Models (CVPR 2025 Highlight)について紹介しました。
以下スライド中の参考文献のリンク
[1]: https://arxiv.org/abs/2112.03857
[2]: https://arxiv.org/abs/2206.05836
[3]: https://arxiv.org/abs/2103.00020
[4]: https://arxiv.org/abs/2303.02489
[5]: https://arxiv.org/abs/2404.09216
[6]: https://arxiv.org/abs/2305.06500
[7]: https://arxiv.org/abs/2303.05499
[8]: https://arxiv.org/abs/2401.02361
[9]: https://huggingface.co/lmms-lab/llava-onevision-qwen2-0.5b-ov
[10]: https://arxiv.org/abs/2304.03752
[11]: https://arxiv.org/abs/2304.08485
[12]: https://huggingface.co/Qwen/Qwen2-VL-72B