问题
如果自己的电脑性能一般不能host LLM,又不能用openai(因为在China)。那么花点小钱买AI服务,使用比如llama这样的LLM模型就是一个方案。但是貌似市面上这种服务有点多,我这里做个简单的收集,后续用了再更新。
结果 (2025Mar11为止)
https://openrouter.ai/ 个人选择openrouter
研究
首先就是几大云服务提供商,比如AWS,Azure,这里不赘述。
https://www.gartner.com/reviews/market/generative-ai-model-providers 这是gartner的一个review列表,可以参考
https://www.reddit.com/r/LocalLLaMA/comments/1cpgxtb/whats_the_cost_of_running_llama38b_70b_in_the/ 这是reddit上的LocalLLama论坛里的一个帖子,这个论坛还挺活跃的,可以多参考。
https://artificialanalysis.ai/models 这是一个分析LLM模型相关的网站,比较了价格、响应速度等等,值得参考。比如Llama3.1 405B的比较 https://artificialanalysis.ai/models/llama-3-1-instruct-405b
https://www.llama.com/docs/getting-the-models/405b-partners 这是405B的partners列表
https://llmpricecheck.com/deepinfra/llama-3-70b-instruct/ 这也是个价格比较网站
https://anotherwrapper.com/tools/llm-pricing 又是一个比较网站
https://blog.cloudflare.com/meta-llama-3-available-on-cloudflare-workers-ai/ cloudflare也可以用
https://build.nvidia.com/meta/llama-3_1-405b-instruct
https://scale.com/genai-platform
https://www.lepton.ai/pricing 这个是贾扬清创业做的网站,也是提供AI服务
https://modelscope.cn/models/LLM-Research/Meta-Llama-3-8B-Instruct
结论
TODO