文档
gpt-oss-20b
一种紧凑、开放权重的语言模型,针对低延迟和资源受限的环境进行了优化,包括本地和边缘部署。
最大输出
8K
上下文
128K
输入
0.56元/百万Token
输出
2.4元/百万Token