Antkillerfarm Hacking V8.0

Chip » CPU(四), DPU, AMD, ARM, 芯片杂烩

2022-10-26 :: 5295 Words

CPU

https://zhuanlan.zhihu.com/p/86432216

Microcode是什么?它为什么能修正CPU硬件错误?

https://www.zhihu.com/question/503287789

当两个CPU核心要求读写同一内存地址时,其后果是未定义行为吗?

https://mp.weixin.qq.com/s/Kake5sQm79L2j_uDqKfznQ

在《我的世界》里从零打造一台计算机有多难?复旦本科生大神花费了一年心血

https://www.zhihu.com/question/562917157

为什么intel的7nm工艺的处理器没有像amd的那样积热那么严重?

https://www.zhihu.com/question/552957041

书上说代码地址总是从0x400000开始,但是查看编译好的elf头起始地址是从0开始的,这是为什么?

https://www.zhihu.com/question/67749141

如何看待英特尔管理引擎(Intel ME)被爆出运行在Minix3操作系统?

https://www.zhihu.com/question/387240856

为啥arm架构比x86 x64省电?

DPU

如同GPU是针对图像显示领域的加速,DPU(Data Processing Unit)则是对于数据传输方面的加速。

https://zhuanlan.zhihu.com/p/145142691

什么是DPU?

https://mp.weixin.qq.com/s/bL1PoUjZ_sH2VKcBxI6N5A

Wave公司发布数据流处理架构DPU

https://zhuanlan.zhihu.com/p/409507738

写一下DPU

https://www.zhihu.com/question/471238373

dpu芯片发展前景如何?

https://mp.weixin.qq.com/s/xRvXCpHpDnMqSNjJyIf3XQ

大话DPU

https://mp.weixin.qq.com/s/hN8tZ7xCRttIc-3pXdqElQ

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》,94页pdf

https://zhuanlan.zhihu.com/p/430203049

在IPU/DPU/SmartNIC中P4能成为主流吗?

AMD

CPU

Bulldozer (推土机) -> Piledriver (打桩机) -> Streamroller (压路机) -> Excavator (挖土机) -> Zen -> Zen+ -> Zen 2 -> Zen 3

这些架构均采用农用设备命名,所以自然AMD被称为“农企”(Agriculture Machine Devices)。


在Zen 2架构中,处理器不再是一个单一的大核心,而是被分为了CCD核心和I/O核心两个部分。

CCD核心和I/O核心之间通过Infinity Fabric总线连接。

3D V-Cache技术,通过在CCD上堆叠额外的缓存,显著提升了处理器的性能。

Matrix Core

对标英伟达Tensor Core,AMD推出Matrix Core。

高速互联

对标NVLink,AMD推出了:

GMI:Global Memory Interconnect

AMD Infinity Fabric Link

其实Intel也有一个叫做Xelink的东西。

IBM BlueLink

HIP

HIP:Heterogeneous Interface for Portability。

HIP是AMD提出的C++接口,号称能兼容CUDA和自家的ROCm。

https://zhuanlan.zhihu.com/p/545296023

写给CUDA开发者AMD ROCm & Intel oneAPI开发贴士

Composable Kernel

Composable Kernel(CK)库旨在提供一套在AMD GPU上算子融合的后端方案。

https://www.sohu.com/a/603796560_129720

AMD Composable Kernel: 定制化算子融合,大幅提升AI端到端性能

AITemplate

AITemplate首先在Python层寻找最优的kernel配置,生成Jinja2 template,再生成C++ template:

  • NVIDIA GPU:基于CUTLASS的GPU Tensor Core C++ template;

  • AMD GPU:基于CK(Composable Kernel)的Matrix Core C++ Template。

官网:

https://github.com/facebookincubator/AITemplate

参考:

https://www.zhihu.com/question/557608132

如何看待Meta发布的全新推理引擎AITemplate?

AI服务器

AMD Instinct系列,大致对标NVIDIA DGX。

官网:

https://www.amd.com/zh-hans/graphics/instinct-server-accelerators


https://zhuanlan.zhihu.com/p/434686566

AMD CDNA2架构(MI200)

https://www.zhihu.com/question/606505567

如何看待AMD发布Instinct MI300X GPU芯片?是否在大模型时代威胁Nvidia地位?

其他对标术语

AMD NVIDIA
GCN wavefront(64 threads wide) CUDA warp(32 threads wide)

参考

罗家是台南水仙宫一带的世家。


以前的算法比较简单,数据吞吐量小,AMD的短流水线渲染单元数量多所以效率高。到了Ethash这类重IO算法主流的年代,其实A卡效率还略有优势,但是没以前那么夸张,所以N卡也被拉出来挖。


A卡的新驱动对于老游戏的支持有些差,解决办法:删除游戏目录下的dbghelp.dll文件。


https://www.zhihu.com/question/593343983

截至2023年4月,用AMD显卡做机器学习怎么样?

https://zhuanlan.zhihu.com/p/651797296

通过“最差实践”实验探索AMD GPU调度细节

ARM

ARM的CPU主要有以下系列:

  • Neoverse:主打服务器领域。
  • Cortex R:实时系统。
  • Cortex-M:嵌入式微控制器。
  • Cortex-A:主流领域。
  • Cortex-X:自从ARM在Cortex A77发布后,ARM就再也无法在保持PPA均衡的基础上继续显著的年化性能提升。因此,ARM从那个时候就开辟了一条全新的Cortex X产品线,依靠牺牲一部分成本和功耗,换取性能提升的余地,并朝着苹果的A系列追逐。

https://www.zhihu.com/tardis/zm/art/537029274

ARM次世代核心Cortex X3/A715/A510简评:降本增效,问题依旧

https://zhuanlan.zhihu.com/p/694560307

麒麟9010微架构评测:轻舟已过万重山

芯片杂烩

我接触到的芯片分门别类罗列如下:

类别 名称 厂家
Low MCU(追求低价) LPC4088 NXP
Hi MCU(追求性能) ASAP1826T alphascale
MDM9215M Qualcomm
Wifi Low Power SOC QCA4002 Qualcomm Atheros
RTL8711AF Realtek
ESP8266 Espressif(乐鑫)
BLE SOC QN9021 NXP
Wifi SOC RTL8881AB Realtek
MT7620A MTK
Nand Flash MT29F4G08ABBEAH4 Micron Technology
HY27UF081G2A Hynix
Wifi Audio RTL8871AM Realtek
RT5350F Ralink
AR9331 Qualcomm Atheros
ATV3603 炬力
Audio Codec WM8728 Wolfson
TAS5731M Texas Instruments
MAX5556 MAXIM

芯片行业+

那时行政院成立“台积电”与“联电”,分别交给张忠谋与曹兴诚。这两位在工研院就闹得不可开交,只好开两家公司给他们管。

台积电是很敢给工程师,联电是很敢给股东。后来就是优秀的工程师都往台积电跑,联电股票涨完几波,就后继无力。


https://xueqiu.com/4081695675/165884010

梁梦松离职的四个点评

https://mp.weixin.qq.com/s/p2f59OngEOKFuELHEIl-hw

科普:芯片行业所说的IP是个什么东西?



Synopsys、Cadence、Siemens EDA(原Mentor)三大巨头垄断了全球EDA行业接近70%左右的市场份额。


项目管理中项目进度: WS=>ES=>CS=>MP

WS:Working Sample

ES:Engineering Sample

CS:Commercial Sample

MP:mass product

所以,可以理解为ES是工程样品,CS是出货样品。

“稼动率”(activation或utilization),是指设备在所能提供的时间内为了创造价值而占用的时间所占的比重。


Tape out是指芯片完成了设计,将设计数据交给fab开始生产,很多年前,完成的设计数据都是写到磁带里传给fab,设计团队将数据写入磁带叫tape in,fab读取磁带的数据叫tape out,现在科技发展了已经不用磁带了,但这个词还是沿用了下来。

wafer out是指wafer在fab完成了生产,设计的集成电路已经制造在硅基上了,开始要封装测试了。


全世界芯片行业目前的薪酬排名(仅对普通工程师而言):

美国西部硅谷附近 > 洛杉矶附近 > 上海和深圳 > 美国东部 > 欧洲,欧洲约等于日韩台湾 > 印度 > 东南亚


当年韩国为了发展半导体,没有专家和技术人才就去日本请人家半导体公司的专家,周六,周日来到韩国给他们指导一下,给的工资是日本的三倍。


https://zhuanlan.zhihu.com/p/342808728

谈谈ARM/MIPS的Archi-license架构许可模式、IP core授权模式,及其商业规则


就晶圆代工而言,台湾在全球前十晶圆代工中占据了4位,分别是台积电,联电,世界先进和力积电,其中台积电的实力世界第一。

就芯片设计而言,台湾在全球前十芯片设计中占据了2位,分别是联发科和丽台。其它8位都是美国的公司。

就芯片封装而言,台湾在全球前十封装中占据了5位,分别是日月光,力成,京元电,南茂和欣帮。其中日月光的实力世界第一。

https://www.zhihu.com/question/658713475

台湾的芯片行业到底在世界上是什么水平?


不是说台积电美国工厂诸多不顺 ,面临一个又一个严重问题,为何现在会传出良率高于台湾工厂,这合理吗?

建厂问题造成的delay终将在建厂完成,设备move in调适生产后就进入正轨,因为这些问题只牵涉建厂不涉及芯片制造。

英特尔,美光,GF以及德国的英飞凌在欧美国家生产芯片,虽然竞争力不如东亚,但人家不也生产的好好的,这些欧美的Fab厂核心问题一样是稼动率,全球缺芯的时候,这些工厂稼动率高,一样赚得盆满砵满。工程师卷不卷的工作态度以及工会问题都是次要的。

Fork me on GitHub