免费大模型API调用汇总
以下是目前可免费调用的大模型API及其关键信息汇总,结合多个可靠来源整理而成:
一、国内官方平台提供的免费API
-
科大讯飞星火Lite API
- 特点:永久免费,支持联网搜索,适用于轻量级应用场景,覆盖金融、能源等12个行业知识。
- 免费额度:无限Tokens,QPS限制为2次/秒。
-
国家超算互联网平台
- QwQ-32B(阿里Qwen团队开发):新用户免费100万Tokens,支持数学推理与代码生成,性能对标DeepSeek-R1。
- DeepSeek-R1系列(7B/14B版本):提供100万Tokens免费试用,可通过超算平台直接部署或调用API。
-
智谱AI GLM-4-Flash
- 特点:完全免费,支持生成创意内容(如儿童绘本),需注册获取API Key,集成简单。
- 适用场景:文本生成、多轮对话,兼容流式输出。
-
百度千帆大模型平台
- 免费模型:ERNIE-Speed-8K、ERNIE-Lite等,TPM(每分钟Tokens)限制为30万,适用于通用对话与数据分析。
-
腾讯混元hunyuan-lite
- 免费额度:并发数限制为5路,适合基础对话和内容生成。
-
字节扣子(豆包)
- 免费模型:Function Call模型,每日3000次请求,适合轻量级应用开发。
二、开源项目与第三方API服务
-
DeepSeek-Free-API(开源项目)
- 特点:兼容OpenAI接口,支持流式输出和多轮对话,需本地部署或使用Docker。
- 模型:DeepSeek系列,可通过多账号Token拼接提升并发能力。
-
硅基流动(Qwen2.5等)
- 免费模型:Qwen2-7B-Instruct等,RPM限制为100,QPS限制为3。
-
OpenRouter
- 特点:聚合多模型API,免费模型包括Gemma、Llama3等,每日200次调用,适合多模型对比测试。
三、国际平台与开源社区
-
Groq
- 免费模型:Llama3、Mixtral等,每日14400次调用,支持高速推理(每秒500 Tokens)。
-
Google AI Studio(Gemini系列)
- 免费额度:每日1500次调用,支持多模态输入与代码生成。
-
HuggingFace
- 免费模型:丰富的开源模型库(如Mistral、Qwen),每小时300次调用,需自部署或使用托管服务。
-
CloudFlare Workers AI
- 特点:Beta模型无调用限制,支持DeepSeek、Gemma等,适合快速验证AI功能。
四、其他推荐
- 阿里云百炼Qwen:新用户可获免费额度,支持私有化部署。
- Moonshot AI(Kimi):支持超长上下文(20万字输入),新用户赠送15元体验金。
- Mistral:每日2000次免费调用,适合创意写作与翻译。
选择建议
- 个人开发者:优先选择无限Tokens的讯飞星火Lite、国家超算平台的百万Token额度,或开源项目(如DeepSeek-Free-API)。
- 企业测试:可试用Groq、Google Gemini等高性能模型,结合国产平台的行业定制能力(如智谱GLM-4-Flash)。
- 复杂场景:需关注并发限制和模型性能,例如腾讯混元、百度ERNIE-Speed更适合高吞吐需求。
更多详细配置和代码示例可参考各平台官方文档(如讯飞星火控制台、智谱AI开放平台)。