Antkillerfarm Hacking V7.5

Chip » CPU(四), DPU, AMD, ARM

2022-10-26 :: 4473 Words

CPU

https://mp.weixin.qq.com/s/_NcQ-PxNpEtpYdo450Uukg

半导体材料全球格局

https://mp.weixin.qq.com/s/QwE_VTEUS9kGDDrHlzPYmg

硅片为什么不是方的?

https://zhuanlan.zhihu.com/p/32378843

ARM攒机指南-汽车篇

https://mp.weixin.qq.com/s/Hq9hzkyfGcCQa_FfzSDoRg

5nm工艺节点以后,半导体器件的发展方向

https://zhuanlan.zhihu.com/p/66263349

为什么内存和闪存制程比CPU低?它们现在都在什么节点?

https://zhuanlan.zhihu.com/p/114448236

什么是Win10的“现代待机”?为什么它未来会越来越重要?这篇文章部分解释了我的第一个平板为什么那么耗电。

https://mp.weixin.qq.com/s/J7RlmvU7JY1J8rV-eqjQ2A

浅谈多核心CPU和SoC芯片及其工作原理

https://mp.weixin.qq.com/s/Lnrlv7JcrOSwbnDweYf1Yg

片上系统设计案例分析-Xbox主机

https://zhuanlan.zhihu.com/p/86432216

Microcode是什么?它为什么能修正CPU硬件错误?

https://www.zhihu.com/question/503287789

当两个CPU核心要求读写同一内存地址时,其后果是未定义行为吗?

https://mp.weixin.qq.com/s/Kake5sQm79L2j_uDqKfznQ

在《我的世界》里从零打造一台计算机有多难?复旦本科生大神花费了一年心血

https://www.zhihu.com/question/562917157

为什么intel的7nm工艺的处理器没有像amd的那样积热那么严重?

https://www.zhihu.com/question/552957041

书上说代码地址总是从0x400000开始,但是查看编译好的elf头起始地址是从0开始的,这是为什么?

https://www.zhihu.com/question/67749141

如何看待英特尔管理引擎(Intel ME)被爆出运行在Minix3操作系统?

https://www.zhihu.com/question/387240856

为啥arm架构比x86 x64省电?

DPU

如同GPU是针对图像显示领域的加速,DPU(Data Processing Unit)则是对于数据传输方面的加速。

https://zhuanlan.zhihu.com/p/145142691

什么是DPU?

https://mp.weixin.qq.com/s/bL1PoUjZ_sH2VKcBxI6N5A

Wave公司发布数据流处理架构DPU

https://zhuanlan.zhihu.com/p/409507738

写一下DPU

https://www.zhihu.com/question/471238373

dpu芯片发展前景如何?

https://mp.weixin.qq.com/s/xRvXCpHpDnMqSNjJyIf3XQ

大话DPU

https://mp.weixin.qq.com/s/hN8tZ7xCRttIc-3pXdqElQ

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》,94页pdf

https://zhuanlan.zhihu.com/p/430203049

在IPU/DPU/SmartNIC中P4能成为主流吗?

AMD

CPU

Bulldozer (推土机) -> Piledriver (打桩机) -> Streamroller (压路机) -> Excavator (挖土机) -> Zen -> Zen+ -> Zen 2 -> Zen 3

Matrix Core

对标英伟达Tensor Core,AMD推出Matrix Core。

高速互联

对标NVLink,AMD推出了:

GMI:Global Memory Interconnect

AMD Infinity Fabric Link

其实Intel也有一个叫做Xelink的东西。

IBM BlueLink

HIP

HIP:Heterogeneous Interface for Portability。

HIP是AMD提出的C++接口,号称能兼容CUDA和自家的ROCm。

https://zhuanlan.zhihu.com/p/545296023

写给CUDA开发者AMD ROCm & Intel oneAPI开发贴士

Composable Kernel

Composable Kernel(CK)库旨在提供一套在AMD GPU上算子融合的后端方案。

https://www.sohu.com/a/603796560_129720

AMD Composable Kernel: 定制化算子融合,大幅提升AI端到端性能

AITemplate

AITemplate首先在Python层寻找最优的kernel配置,生成Jinja2 template,再生成C++ template:

  • NVIDIA GPU:基于CUTLASS的GPU Tensor Core C++ template;

  • AMD GPU:基于CK(Composable Kernel)的Matrix Core C++ Template。

官网:

https://github.com/facebookincubator/AITemplate

参考:

https://www.zhihu.com/question/557608132

如何看待Meta发布的全新推理引擎AITemplate?

AI服务器

AMD Instinct系列,大致对标NVIDIA DGX。

官网:

https://www.amd.com/zh-hans/graphics/instinct-server-accelerators


https://zhuanlan.zhihu.com/p/434686566

AMD CDNA2架构(MI200)

https://www.zhihu.com/question/606505567

如何看待AMD发布Instinct MI300X GPU芯片?是否在大模型时代威胁Nvidia地位?

其他对标术语

AMD NVIDIA
GCN wavefront(64 threads wide) CUDA warp(32 threads wide)

参考

罗家是台南水仙宫一带的世家。


以前的算法比较简单,数据吞吐量小,AMD的短流水线渲染单元数量多所以效率高。到了Ethash这类重IO算法主流的年代,其实A卡效率还略有优势,但是没以前那么夸张,所以N卡也被拉出来挖。


A卡的新驱动对于老游戏的支持有些差,解决办法:删除游戏目录下的dbghelp.dll文件。


https://www.zhihu.com/question/593343983

截至2023年4月,用AMD显卡做机器学习怎么样?

https://zhuanlan.zhihu.com/p/651797296

通过“最差实践”实验探索AMD GPU调度细节

ARM

ARM的CPU主要有以下系列:

  • Neoverse:主打服务器领域。
  • Cortex R:实时系统。
  • Cortex-M:嵌入式微控制器。
  • Cortex-A:主流领域。
  • Cortex-X:自从ARM在Cortex A77发布后,ARM就再也无法在保持PPA均衡的基础上继续显著的年化性能提升。因此,ARM从那个时候就开辟了一条全新的Cortex X产品线,依靠牺牲一部分成本和功耗,换取性能提升的余地,并朝着苹果的A系列追逐。

https://www.zhihu.com/tardis/zm/art/537029274

ARM次世代核心Cortex X3/A715/A510简评:降本增效,问题依旧

https://zhuanlan.zhihu.com/p/694560307

麒麟9010微架构评测:轻舟已过万重山

芯片行业+

Tape out是指芯片完成了设计,将设计数据交给fab开始生产,很多年前,完成的设计数据都是写到磁带里传给fab,设计团队将数据写入磁带叫tape in,fab读取磁带的数据叫tape out,现在科技发展了已经不用磁带了,但这个词还是沿用了下来。

wafer out是指wafer在fab完成了生产,设计的集成电路已经制造在硅基上了,开始要封装测试了。


全世界芯片行业目前的薪酬排名(仅对普通工程师而言):

美国西部硅谷附近 > 洛杉矶附近 > 上海和深圳 > 美国东部 > 欧洲,欧洲约等于日韩台湾 > 印度 > 东南亚


当年韩国为了发展半导体,没有专家和技术人才就去日本请人家半导体公司的专家,周六,周日来到韩国给他们指导一下,给的工资是日本的三倍。


https://zhuanlan.zhihu.com/p/342808728

谈谈ARM/MIPS的Archi-license架构许可模式、IP core授权模式,及其商业规则


就晶圆代工而言,台湾在全球前十晶圆代工中占据了4位,分别是台积电,联电,世界先进和力积电,其中台积电的实力世界第一。

就芯片设计而言,台湾在全球前十芯片设计中占据了2位,分别是联发科和丽台。其它8位都是美国的公司。

就芯片封装而言,台湾在全球前十封装中占据了5位,分别是日月光,力成,京元电,南茂和欣帮。其中日月光的实力世界第一。

https://www.zhihu.com/question/658713475

台湾的芯片行业到底在世界上是什么水平?


不是说台积电美国工厂诸多不顺 ,面临一个又一个严重问题,为何现在会传出良率高于台湾工厂,这合理吗?

建厂问题造成的delay终将在建厂完成,设备move in调适生产后就进入正轨,因为这些问题只牵涉建厂不涉及芯片制造。

英特尔,美光,GF以及德国的英飞凌在欧美国家生产芯片,虽然竞争力不如东亚,但人家不也生产的好好的,这些欧美的Fab厂核心问题一样是稼动率,全球缺芯的时候,这些工厂稼动率高,一样赚得盆满砵满。工程师卷不卷的工作态度以及工会问题都是次要的。

Fork me on GitHub