第 11 章：性能优化 - Base64 完整教程

1. 预计算输出大小

最简单的优化是避免内存重分配。Base64 编码后的长度是确定的：Ceil(n / 3) * 4。

在各种语言（如 C++, Java, Go）中，如果在创建缓冲区（Buffer/StringBuilder）时直接指定这个大小，可以避免多次扩容带来的性能损耗。

在解码时，将字符转换为索引值。初学者可能会写出大量的 if-else 或 switch-case。

优化方案： 建立一个大小为 256 的数组（Lookup Table），直接用 ASCII 码作为下标获取索引值。这可以将时间复杂度降为 O(1)。

// 查表法伪代码
int decodeTable[256]; 
// 初始化 decodeTable['A'] = 0, decodeTable['B'] = 1, ...

// 解码
index = decodeTable[char];

现代 CPU (Intel/AMD/ARM) 提供了 SIMD（单指令多数据流）指令集，如 AVX2、AVX-512、NEON。

利用特殊的 shuffle 指令，可以一次性处理 32字节甚至 64字节的数据，而不是每次只处理 3 字节。这由于打破了数据依赖，能带来 10-20 倍的性能提升。

普通查表

~ 0.5 GB/s

AVX2

~ 5.0 GB/s

AVX-512

~ 10.0 GB/s