https://mp.weixin.qq.com/s/_NcQ-PxNpEtpYdo450Uukg
半导体材料全球格局
https://mp.weixin.qq.com/s/QwE_VTEUS9kGDDrHlzPYmg
硅片为什么不是方的?
https://zhuanlan.zhihu.com/p/32378843
ARM攒机指南-汽车篇
https://mp.weixin.qq.com/s/Hq9hzkyfGcCQa_FfzSDoRg
5nm工艺节点以后,半导体器件的发展方向
https://zhuanlan.zhihu.com/p/66263349
为什么内存和闪存制程比CPU低?它们现在都在什么节点?
https://zhuanlan.zhihu.com/p/114448236
什么是Win10的“现代待机”?为什么它未来会越来越重要?这篇文章部分解释了我的第一个平板为什么那么耗电。
https://mp.weixin.qq.com/s/J7RlmvU7JY1J8rV-eqjQ2A
浅谈多核心CPU和SoC芯片及其工作原理
https://mp.weixin.qq.com/s/Lnrlv7JcrOSwbnDweYf1Yg
片上系统设计案例分析-Xbox主机
https://zhuanlan.zhihu.com/p/86432216
Microcode是什么?它为什么能修正CPU硬件错误?
https://www.zhihu.com/question/503287789
当两个CPU核心要求读写同一内存地址时,其后果是未定义行为吗?
https://mp.weixin.qq.com/s/Kake5sQm79L2j_uDqKfznQ
在《我的世界》里从零打造一台计算机有多难?复旦本科生大神花费了一年心血
https://www.zhihu.com/question/562917157
为什么intel的7nm工艺的处理器没有像amd的那样积热那么严重?
https://www.zhihu.com/question/552957041
书上说代码地址总是从0x400000开始,但是查看编译好的elf头起始地址是从0开始的,这是为什么?
https://www.zhihu.com/question/67749141
如何看待英特尔管理引擎(Intel ME)被爆出运行在Minix3操作系统?
https://www.zhihu.com/question/387240856
为啥arm架构比x86 x64省电?
如同GPU是针对图像显示领域的加速,DPU(Data Processing Unit)则是对于数据传输方面的加速。
https://zhuanlan.zhihu.com/p/145142691
什么是DPU?
https://mp.weixin.qq.com/s/bL1PoUjZ_sH2VKcBxI6N5A
Wave公司发布数据流处理架构DPU
https://zhuanlan.zhihu.com/p/409507738
写一下DPU
https://www.zhihu.com/question/471238373
dpu芯片发展前景如何?
https://mp.weixin.qq.com/s/xRvXCpHpDnMqSNjJyIf3XQ
大话DPU
https://mp.weixin.qq.com/s/hN8tZ7xCRttIc-3pXdqElQ
中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》,94页pdf
https://zhuanlan.zhihu.com/p/430203049
在IPU/DPU/SmartNIC中P4能成为主流吗?
Bulldozer (推土机) -> Piledriver (打桩机) -> Streamroller (压路机) -> Excavator (挖土机) -> Zen -> Zen+ -> Zen 2 -> Zen 3
对标英伟达Tensor Core,AMD推出Matrix Core。
对标NVLink,AMD推出了:
GMI:Global Memory Interconnect
AMD Infinity Fabric Link
其实Intel也有一个叫做Xelink的东西。
IBM BlueLink
HIP:Heterogeneous Interface for Portability。
HIP是AMD提出的C++接口,号称能兼容CUDA和自家的ROCm。
https://zhuanlan.zhihu.com/p/545296023
写给CUDA开发者AMD ROCm & Intel oneAPI开发贴士
Composable Kernel(CK)库旨在提供一套在AMD GPU上算子融合的后端方案。
https://www.sohu.com/a/603796560_129720
AMD Composable Kernel: 定制化算子融合,大幅提升AI端到端性能
AITemplate首先在Python层寻找最优的kernel配置,生成Jinja2 template,再生成C++ template:
NVIDIA GPU:基于CUTLASS的GPU Tensor Core C++ template;
AMD GPU:基于CK(Composable Kernel)的Matrix Core C++ Template。
官网:
https://github.com/facebookincubator/AITemplate
参考:
https://www.zhihu.com/question/557608132
如何看待Meta发布的全新推理引擎AITemplate?
AMD Instinct系列,大致对标NVIDIA DGX。
官网:
https://www.amd.com/zh-hans/graphics/instinct-server-accelerators
https://zhuanlan.zhihu.com/p/434686566
AMD CDNA2架构(MI200)
https://www.zhihu.com/question/606505567
如何看待AMD发布Instinct MI300X GPU芯片?是否在大模型时代威胁Nvidia地位?
AMD | NVIDIA |
---|---|
GCN wavefront(64 threads wide) | CUDA warp(32 threads wide) |
罗家是台南水仙宫一带的世家。
以前的算法比较简单,数据吞吐量小,AMD的短流水线渲染单元数量多所以效率高。到了Ethash这类重IO算法主流的年代,其实A卡效率还略有优势,但是没以前那么夸张,所以N卡也被拉出来挖。
A卡的新驱动对于老游戏的支持有些差,解决办法:删除游戏目录下的dbghelp.dll文件。
https://www.zhihu.com/question/593343983
截至2023年4月,用AMD显卡做机器学习怎么样?
https://zhuanlan.zhihu.com/p/651797296
通过“最差实践”实验探索AMD GPU调度细节
ARM的CPU主要有以下系列:
https://www.zhihu.com/tardis/zm/art/537029274
ARM次世代核心Cortex X3/A715/A510简评:降本增效,问题依旧
https://zhuanlan.zhihu.com/p/694560307
麒麟9010微架构评测:轻舟已过万重山
Tape out是指芯片完成了设计,将设计数据交给fab开始生产,很多年前,完成的设计数据都是写到磁带里传给fab,设计团队将数据写入磁带叫tape in,fab读取磁带的数据叫tape out,现在科技发展了已经不用磁带了,但这个词还是沿用了下来。
wafer out是指wafer在fab完成了生产,设计的集成电路已经制造在硅基上了,开始要封装测试了。
全世界芯片行业目前的薪酬排名(仅对普通工程师而言):
美国西部硅谷附近 > 洛杉矶附近 > 上海和深圳 > 美国东部 > 欧洲,欧洲约等于日韩台湾 > 印度 > 东南亚
当年韩国为了发展半导体,没有专家和技术人才就去日本请人家半导体公司的专家,周六,周日来到韩国给他们指导一下,给的工资是日本的三倍。
https://zhuanlan.zhihu.com/p/342808728
谈谈ARM/MIPS的Archi-license架构许可模式、IP core授权模式,及其商业规则
就晶圆代工而言,台湾在全球前十晶圆代工中占据了4位,分别是台积电,联电,世界先进和力积电,其中台积电的实力世界第一。
就芯片设计而言,台湾在全球前十芯片设计中占据了2位,分别是联发科和丽台。其它8位都是美国的公司。
就芯片封装而言,台湾在全球前十封装中占据了5位,分别是日月光,力成,京元电,南茂和欣帮。其中日月光的实力世界第一。
https://www.zhihu.com/question/658713475
台湾的芯片行业到底在世界上是什么水平?
不是说台积电美国工厂诸多不顺 ,面临一个又一个严重问题,为何现在会传出良率高于台湾工厂,这合理吗?
建厂问题造成的delay终将在建厂完成,设备move in调适生产后就进入正轨,因为这些问题只牵涉建厂不涉及芯片制造。
英特尔,美光,GF以及德国的英飞凌在欧美国家生产芯片,虽然竞争力不如东亚,但人家不也生产的好好的,这些欧美的Fab厂核心问题一样是稼动率,全球缺芯的时候,这些工厂稼动率高,一样赚得盆满砵满。工程师卷不卷的工作态度以及工会问题都是次要的。
您的打赏,是对我的鼓励