【玩转腾讯云】深度学习之《深度学习入门》学习笔记(三)神经网络
最近学习吴恩达《Machine Learning》课程以及《深度学习入门:基于Python的理论与实现》书,一些东西总结了下。现就后者学习进行笔记总结。本文是本书的学习笔记(三)神经网络。
【玩转腾讯云】深度学习之《深度学习入门》学习笔记(三)神经网络
最近学习吴恩达《Machine Learning》课程以及《深度学习入门:基于Python的理论与实现》书,一些东西总结了下。现就后者学习进行笔记总结。本文是本书的学习笔记(三)神经网络。
C++性能优化系列——3D高斯核卷积计算(八)3D高斯卷积
因为是按照X Y Z的计算顺序,因此只能够在计算X维度的卷积时,复用之前实现的一维卷积计算函数。Y维度的计算是将一个Z平面上的二维数据中每行与卷积核中一个点相乘,并将31个点的卷积核计算出的结果累加至一行,更新到中间缓存的目标位置。Z维度的计算是将一个Z平面的二维数据和卷积核中的一个点相乘,并将31个点的卷积核计算出的结果累加至一个二维平面,更新到结果的目标位置。这里对Y 和 Z维度的计算都是通过编译器ICC实现向量化。 代码实现如下:
C++性能优化系列——3D高斯核卷积计算(八)3D高斯卷积
因为是按照X Y Z的计算顺序,因此只能够在计算X维度的卷积时,复用之前实现的一维卷积计算函数。Y维度的计算是将一个Z平面上的二维数据中每行与卷积核中一个点相乘,并将31个点的卷积核计算出的结果累加至一行,更新到中间缓存的目标位置。Z维度的计算是将一个Z平面的二维数据和卷积核中的一个点相乘,并将31个点的卷积核计算出的结果累加至一个二维平面,更新到结果的目标位置。这里对Y 和 Z维度的计算都是通过编译器ICC实现向量化。 代码实现如下:
计算机视觉 OpenCV Android | 图像操作之 统计排序滤波、边缘保留滤波
上述代码将会生成一个3×3大小的矩形结构元素。
使用该结构元素实现最大值或者最小值滤波的代码如下:
【云原生攻防研究】容器环境相关的内核漏洞缓解技术
在容器逃逸技术概览一文中我们提到,由于容器与宿主机共享内核,内核漏洞成为容器逃逸的四大原因之一。由于潜在后果的严重性(提升至系统最高权限)和影响的广泛性(一个漏洞会影响相当多的计算机设备),系统开发者陆续在内核实现了一系列的漏洞缓解技术,以减小内核被攻破的可能性。
CUDA优化的冷知识 4 | 打工人的时间是如何计算的
https://docs.nvidia.com/cuda/cuda-c-best-practices-guide/index.html 来阅读原文。
2017 Linux 内核开发报告 Linux统治着计算机世界
现在是 2017 年,Linux 在统治着计算机世界。不相信?Linux 基金会报告说,Linux 运行着 90% 的公共云工作量,世界上 82% 的智能手机,62% 的嵌入式市场,以及几乎占领了 99% 的超级计算机市场。所有的这些都基于 Linux 内核。在 Linux 基金会 2017 的 Linux Kernel 开发报告中 ,Linux 内核开发者和 LWN.net 的编辑 Jonathan Corbet 以及稳定的 Linux 内核维护者 Greg Kroah-Hartman 报告了 Linux 最新的发展。
《深入理解计算机系统》(CSAPP)实验五 —— Perfom Lab
本次实验主要处理优化内存密集型代码。图像处理提供了许多可以从优化中受益的功能示例。在本实验中,我们将考虑两种图像处理操作:旋转,可将图像逆时针旋转90o,平滑,可以“平滑”或“模糊”图片。
云架构系统如何做性能分析?| 实战干货
性能分析一直是性能实施项目中的一个难点。对于只做性能测试不做性能分析的团队来说,总是不能把问题非常显性地展示出来,不能给其他团队非常明确的引导。对于这种类型的测试实施,只能把问题抛出来,让其他相关团队去查。沟通成本很高。
而一个成熟的性能团队应该是要把问题点分析出来,给其他团队或责任人非常明确的瓶颈点,以加快问题的处理进度。
从完整的分析思路上考虑。有两个要点:分段和分层。
opencl:获取每个计算单元(CU)中处理元件(PE)的数目
版权声明:本文为博主原创文章,转载请注明源地址。 https://blog.csdn.net/10km/article/details/51480033
腾讯云NLP大模型预训练最佳实践
根据当前人工智能的趋势,越大的自然语言模型可以提供越好的准确性,目前GPT-3的模型参数达到175B。但是由于成本、时间和代码集成的障碍,较大的模型难以训练。
Udacity并行计算课程笔记-The GPU Hardware and Parallel Communication Patterns
本小节笔记大纲:
1.Communication patterns
gather,scatter,stencil,transpose
2.GPU hardware & Programming Model
SMs,threads,blocks,ordering
Synchronization
Memory model: local, shared, global
Atomic Operation
3.Efficient GPU Programming
Access memory faster
co
计算机视觉中的注意力相关论文
1、The Application of Two-level Attention Models in Deep Convolutional Neural Network for Fine-grained Image Classification
云服务器深度学习环境搭建
1. 登录 NVIDIA 驱动下载 或打开链接 http://www.nvidia.com/Download/Find.aspx 。
云服务器深度学习环境搭建
1. 登录 NVIDIA 驱动下载 或打开链接 http://www.nvidia.com/Download/Find.aspx 。
云服务器深度学习环境搭建
1. 登录 NVIDIA 驱动下载 或打开链接 http://www.nvidia.com/Download/Find.aspx 。
AI面试题之(反)卷积输出尺寸计算
】这个就是原来的图片,外面加了一圈padding,因为padding是一圈,所以左右、上下都有,所以是两倍的。
Jetson Nano IO物理引脚与虚拟引脚映射计算
由于项目需求,需要使用Jetson Nano进行io输入采集和输出控制,在网上查找到的资料无法满足所需,有些虚拟引脚号无法得到,以至于无法对相应的io进行操作。
计算 Linux 内存使用率方法及C实现
通过获取Linux中的 /proc/stat 文件中的内容可以获取系统内存的详细信息: