首先要想清楚一件事:你的业务瓶颈在哪。这听起来是废话,但真的很多人跳过了这步。做 Web 应用的和跑机器学习的,选法完全不一样。Web 服务通常是 CPU 和内存先到瓶颈,I/O 压力次之,GPU 基本不需要;跑模型训练的反过来,GPU 才是命根子,CPU 够用就行。所以第一步,把自己的负载类型搞清楚,别一上来就问"哪款性价比高",这个问题没有通用答案。
选云服务器的话,实例类型别乱选。通用型实例适合大多数普通业务;计算密集型适合高并发 CPU 运算;内存优化型适合数据库或者缓存服务;网络增强型适合高吞吐传输。很多人不管业务特点,直接选通用型然后加量,结果花了大价钱,瓶颈还是在那。选对实例类型,同样的钱效果能差一倍。
带宽和网络这块很容易被忽视。国内带宽贵是出了名的,很多人买机器的时候眼睛盯着 CPU 和内存,带宽随手选了 1M 或者 5M,上线才发现根本不够用。如果是面向 C 端用户的服务,带宽要认真估算,实在不确定可以选按流量计费,初期灵活,流量稳定之后再切换固定带宽套餐通常更省。另外跨地域部署的话,国内到香港、到海外的线路质量差异很大,别只看价格,稳定性和延迟也要测。