跳到主要内容

1 篇文档带有标签「document-understanding」

查看所有标签

8 Multi-modal Prompting

Vision-text prompting, document understanding, video analysis, and cross-modal reasoning with GPT-4V, Claude, and Gemini