【提示工程】谷歌设计多模态提示
developer.chat
30 August 2025
Vertex AI中的Gemini API允许您发送包括文本、图像和视频在内的多模式输入,作为Gemini模型提示的一部分。本页提供了设计多模式提示的最佳实践,以及在提示未按预期工作时如何进行故障排除。有关快速设计的一般指导,请参阅我们推荐的快速设计策略,或参阅以下多式联运特定最佳实践列表。
快速设计基础
使用具体说明
清晰详细的提示可提供最佳结果。如果您心中有一个特定的输出,请在提示中包含该要求,以增加获得正确输出的可能性。
即使写提示的人似乎很清楚提示,提示也可能没有明确说明。要自定义模型行为,请考虑如何解释您的提示,并确保您给出的说明具体明了。
如果你在提示中包含了下面机场板的图像,要求模型只“描述这张图像”就可以生成一个总体描述。如果您需要模型从图像中解析时间和城市,请将该请求直接包含在提示中。