https://mp.weixin.qq.com/s/uXbLb5ITHOU0dZRSWNobVg
算力限制场景下的目标检测实战浅谈
https://mp.weixin.qq.com/s/DoeoPGnS88HQmxagKJWLlg
小米开源FALSR算法:快速精确轻量级的超分辨率模型
https://mp.weixin.qq.com/s/wT39oUWfrQK-dg7hGXRynQ
实时单人姿态估计,在自己手机上就能实现
https://mp.weixin.qq.com/s/RVsXUnAJ2f0Cby7BPaWifA
人物属性模型移动端实验记录
https://mp.weixin.qq.com/s/yCcK6UJqm850HON7xU3R6g
模型压缩重要方向-动态模型,如何对其长期深入
https://zhuanlan.zhihu.com/p/93020471
轻量型网络:IdleBlock
https://mp.weixin.qq.com/s/AjuTXFmxHYdUUqodSpP_4w
10倍加速!爱奇艺超分辨模型加速实践
https://mp.weixin.qq.com/s/rzv8VCAxBQi0HsUcnLqqUA
处理移动端传感器时序数据的深度学习框架:DeepSense
https://mp.weixin.qq.com/s/UYk3YQmFW7-44RUojUqfGg
上交大ICCV:精度保证下的新型深度网络压缩框架
https://mp.weixin.qq.com/s/ZuEi32ZBSjruvtyUimBgxQ
揭秘支付宝中的深度学习引擎:xNN
https://mp.weixin.qq.com/s/0KlnQ8UUxpyhBRdeo0EOAA
用于网络压缩的滤波器级别剪枝算法ThiNet
https://mp.weixin.qq.com/s/FvR6loJ8KUxm7qwclestcQ
专门为卷积神经网络设计的训练方法:RePr
https://mp.weixin.qq.com/s/67GSnZnJySFrCESvmwhO9A
论文解读Channel pruning for Accelerating Very Deep Neural Networks
https://mp.weixin.qq.com/s/Lkxc_9sbRY157sMWaD5c7g
视频分割在移动端的算法进展综述
https://mp.weixin.qq.com/s/ie2O5BPT-QxTRhK3S0Oa0Q
剪枝需有的放矢,快手&罗切斯特大学提出基于能耗建模的模型压缩
某些特别大或特别小的异常值,对量化会产生较大的精度影响。动态树量化(dynamic tree quantization)就是一种以较低的量化精度损失处理这种情况的方法。
首位是符号位
符号位后连续的0的数量表示指数大小
再之后的第一个值为1的是指示位
线性量化区域
指示位是可以动态移动的,通过移动指示位可以灵活选择更大的范围,还是更高的精度。
论文:
8-BIT OPTIMIZERS VIA BLOCK-WISE QUANTIZATION
论文作者为此开发了bitsandbytes库:
https://github.com/bitsandbytes-foundation/bitsandbytes
因为经常使用import bitsandbytes as bnb
导入,所以该库又被称为bnb。
参考:
https://www.cnblogs.com/chentiao/p/17388568.html
bitsandbytes–Facebook推出8比特优化器大大减少显存
https://mp.weixin.qq.com/s/M79xGWWtJUB6wBVlHXw8ig
低精度神经网络:从数值计算角度优化模型效率
https://www.chiphell.com/thread-1620755-1-1.html
新Titan X的INT8计算到底是什么鬼
https://mp.weixin.qq.com/s/5LhLbzyWTlP2R_zGAIKuiA
INT8量化训练
https://mp.weixin.qq.com/s/S9VcoS_59nbZWe_P3ye2Tw
减少模型半数内存用量:百度&英伟达提出混合精度训练法
https://zhuanlan.zhihu.com/p/35700882
CNN量化技术
https://mp.weixin.qq.com/s/9DXMqiPIK5P5wzUMT7_Vfw
基于交替方向法的循环神经网络多比特量化
https://mp.weixin.qq.com/s/PDeChj1hQqUrZiepxXODJg
ICLR oral:清华提出离散化架构WAGE,神经网络训练推理合二为一
https://mp.weixin.qq.com/s/KgM1k1bziLTCec67hQ8hlQ
超全总结:神经网络加速之量化模型
https://mp.weixin.qq.com/s/7dzQhgblEm-kzRnpddweSw
嵌入式端CNN网络计算的量化-动态定点法(1)
https://mp.weixin.qq.com/s/M3NcH30zY5Wlj76BDPQlMA
模型压缩一半,精度几乎无损,TensorFlow推出半精度浮点量化工具包,还有在线Demo
https://www.zhihu.com/question/498135156
如何看待FAIR提出的8-bit optimizer:效果和32-bit optimizer相当?
https://mp.weixin.qq.com/s/D3ZKidCV7OhAeqWqWg521w
如何训练和部署FP16/Int8等低精度机器学习模型?
https://jackwish.net/neural-network-quantization-introduction-chn.html
神经网络量化简介
https://mp.weixin.qq.com/s/70GuFnJGhtIZEA-PECHjaA
混合精度对模型训练和推理的影响
https://mp.weixin.qq.com/s/xIbF3rNv2mC2G4RBDhIvJQ
哈佛大学在读博士:模型量化——更小更快更强
https://zhuanlan.zhihu.com/p/128018221
8比特数值也能训练模型?商汤提出训练加速新算法
https://zhuanlan.zhihu.com/p/132561405
模型量化了解一下?
https://mp.weixin.qq.com/s/xnszH9WSKGBwqtHUuYua1g
混合精度训练,提速,减内存
https://mp.weixin.qq.com/s/YImszcJDsvw5ygo2wCj3Hw
模型量化的核心技术点有哪些,如何对其进行长期深入学习
https://mp.weixin.qq.com/s/bK0n9u6DIl4SY7mxS8CVRw
模型量化技术原理及其发展现状和展望
https://zhuanlan.zhihu.com/p/223018242
NNIE量化算法及实现
https://zhuanlan.zhihu.com/p/79744430
Tensorflow模型量化(Quantization)原理及其实现方法
https://mp.weixin.qq.com/s/du3hb2oM5X6bMocdOab4dg
模型量化: 只有整数计算的高效推理
https://mp.weixin.qq.com/s/7Si6GQlj8IvYajoVnwm5DQ
INT4量化用于目标检测
https://mp.weixin.qq.com/s/7VEiQ0y8kB4nODtLCx1UQA
模型量化打怪升级之路
https://mp.weixin.qq.com/s/TXWdx3bbBNfaG3yp2G56ew
提速还能不掉点!深度解析MegEngine 4 bits量化开源实现
https://www.zhihu.com/question/627484732
目前针对大模型进行量化的方法有哪些?
前GUR局长上将布尔巴,不知道从哪里找出来“东大病毒配方”和“疫苗配方”给泽连斯基献宝,结果这俩配方全是假的,把泽惹毛了,马上被开掉了。
泰尔马诺沃应该翻译成台尔曼诺沃,词源是德共烈士台尔曼;该地2014年后脱离基辅统治,2016年基辅当局,隔空改名博伊科夫斯科耶。最近基辅当局又改掉一堆“五一村”,真是暴露了买办本质。
普京不就是经典钢四打法吗?战前造合作政府增加对面投降进度,空降兵偷胜利点,南北对进包饺子,btg小编制跑马。结果民工被间谍贪了,合作政府没造出来。空降兵跳的地方对面提前放了兵。南北对进的计划因为后勤原因陷在烂地里了。小编制跑马,跑得倒是挺远,但是胜利点没打下来。最后不得不丢弃辎重跑路,回归划线蹲坑烂仗。
2024年9月,乌克兰军事反情报安全局在敖德萨消灭了一群格鲁乌特工。
敌方特工本应在战争的头几天,组织强行夺取敖德萨的行政大楼,为此他们被许诺在占领当局中任职。
在俄罗斯人意识到不可能占领敖德萨后,特工小组进入了休眠模式。
中东最大的航空航天展览会—-“2023年迪拜航展“汇集了全球领先的民用和军用飞机制造商。在欧美订单纷至沓来时,俄罗斯的国防出口公司却以惨败告终。俄罗斯生意人报报道称,11月13日至17日在迪拜举行的这次航空展会,作为俄罗斯武器出口供应垄断者的Rostec控股公司,没有与合作伙伴签署哪怕一份合同。
您的打赏,是对我的鼓励