在用户和助手之间的对话中生成下一条聊天消息。
模型名称
聊天历史记录,为消息对象数组(每个对象包含 role 和 content)
模型在聊天过程中可能调用的可选函数工具列表
返回响应的格式。可以是 json 或 JSON 模式 (JSON schema)
json 控制文本生成的运行时选项
当为 true 时,除内容外还返回单独的思考过程输出。对于支持的模型,可以是布尔值 (true/false) 或字符串 ("high"、"medium"、"low")。
模型保持活跃时长(例如 5m 或 0 表示立即卸载)
是否返回输出 token 的对数概率 (log probabilities)
启用对数概率时,在每个 token 位置返回的最有可能的 token 数量
聊天响应
用于生成此消息的模型名称
响应创建的时间戳 (ISO 8601)
指示聊天响应是否已结束
响应结束的原因
生成总耗时(单位:纳秒)
加载模型耗时(单位:纳秒)
提示词 (prompt) 中的 token 数量
评估提示词耗时(单位:纳秒)
响应中生成的 token 数量
生成 token 耗时(单位:纳秒)
启用对数概率时,生成的 token 的对数概率信息