主流硬件环境下开采ETH(含ETHW等沿用Ethash算法分叉币种)优先选用混合精度运算,老旧架构低端显卡无张量核心硬件加持时改用单精度FP32运行是最优选择,这套选型逻辑经过海量矿场实测验证,能够在算力稳定性与功耗成本之间实现收益最大化。Ethash算法属于显存密集型哈希运算,运算环节拆分后部分流程不需要全精度浮点校验,混合精度借助FP16半精度完成批量哈希计算、FP32单精度留存关键校验数据的组合模式,刚好适配算法底层运行逻辑,也是过去ETH主网GPU挖矿阶段头部规模化矿场统一采用的优化方案,区别于全单精度一刀切的保守设置。

单精度FP32模式采用32位浮点全数据运算,所有哈希取样、DAG文件读取、哈希碰撞校验全部统一精度,优势是运算容错率极高,几乎不会出现无效份额、算力跳变、矿机闪退拒收份额的问题,GTX10系帕斯卡及更早无TensorCore的老款显卡硬件不原生适配FP16加速,开启混合精度不仅无法提升算力,还会出现程序报错、算力下跌5%至12%的现象,这类硬件只能固定单精度挖矿。但单精度弊端十分突出,同型号显卡满载功耗普遍高出混合精度15%到22%,以RTX3070为例,单精度满载功耗135W左右、常规算力30MH/s,切换合规混合精度后功耗降至108W上下,算力稳定维持在30至31MH/s,长期运行电费损耗差距会持续压缩挖矿净收益,电价偏高的矿点使用全单精度很容易陷入盈亏平衡甚至亏损状态。

混合精度的落地效果依托英伟达安培、阿达架构全系显卡的张量核心硬件,30系、40系消费级显卡与CMP专业矿卡均可完美适配,主流T-Rex、NBminer、Claymore等矿软内置混合精度开关参数,无需修改显卡BIOS,仅需在启动命令行开启精度优化指令即可生效。实际上机调试中,混合精度会对DAG缓存、随机哈希遍历环节启用FP16压缩运算,缩减显存带宽占用,富余的功耗空间可小幅拉高显存超频幅度,多数中端卡能实现算力小幅上浮2%至4%,同时单位算力耗电量持续下降,MH/W能效比提升明显。不过混合精度存在小幅容错短板,显存超频幅度拉满、劣质杂牌显存颗粒的显卡,强行开启混合精度会零星出现无效份额,日常调试只需下调50至100MHz显存频率就能消除异常,整体损耗远低于省电带来的收益增幅。

AMD显卡的精度选择逻辑和N卡存在区分,RX5000系及更早GCN架构AMD显卡硬件对半精度优化偏弱,绝大多数场景维持单精度运行;RX6000、RX7000系RDNA架构新品支持简易混合精度调度,经过内核补丁优化后可小幅省电,但算力提升幅度远不及同级别N卡,因此AMD矿卡多数中小矿工依旧保守选用单精度。搭建多卡集群矿机时,建议分卡差异化设置参数,老旧1060、1660S统一单精度,3060、4060等新卡批量开启混合精度,兼顾整台矿机稳定性与综合功耗控制,避免单卡异常拖累整机算力上报数据。
