Prompt-Cheatsheet
▪ „
![]()
\nFree OCR“ → Plain-Text-OCR für ein Bild
▪ „
![]()
<|grounding|>\nFree OCR“
→ Plain-Text mit absatzbasierten Bounding-Boxen
▪ „
![]()
<|grounding|>\nConvert the document to markdown“
→ Markdown mit Bounding-Boxen
▪ “
![]()
<|grounding|>\nLocate: Tennisball“
→ findet alle Tennisbälle auf dem Bild und gibt die Bounding-Boxen zurück
▪ „
![]()
\nParse the figure“ → wandelt Visualisierungen in strukturierte Daten um
➔ Die Beeinflussbarkeit von DeepSeek OCR ist eingeschränkt!
Vision, OCR, Bounding-Boxen?
Was zu tun ist, wenn im PDF kein Text steht
DeepSeek OCR