卷积 神经网络 深度 模型

网络架构设计汇总

1.企业网络基本架构 企业网络架构很大程度上取决于企业或机构的业务需求。 小型企业:通常只有一个办公地点,一般采用扁平网络架构进行组网。这种扁平网络能够满足用户对资源访问的需求,并具有较强的灵活性,同时又能大大减少部署和维护成本。 网络通常缺少冗余机制,可靠性不高,容易发生业务中断 大型企业:网络对 ......
架构 网络

GPT模型: Generative Pre-training 生成式无监督预训练

GPT,GPT-2,GPT-3 论文精读【论文精读】_哔哩哔哩_bilibili ELMo:将上下文当作特征,但是无监督的语料和我们真实的语料还是有区别的,不一定符合我们特定的任务,是一种双向的特征提取。 OpenAI GPT: 通过transformer decoder学习出来一个语言模型,不是固 ......
Pre-training Generative training 模型 GPT

预训练模型-从BERT原理到BERT调包和微调

一、BERT原理 BERT取名来自 Bidirectional Encoder Representations from Transformers。架构为:预训练 + fine-tuning(对于特定的任务只需要添加一个输出层)。 1、引言 通过预训练语言模型可显著提高NLP下游任务。限制模型潜力的 ......
BERT 模型 原理

深度学习Pytorch中组卷积的参数存储方式与剪枝的问题

写这个主要是因为去年做项目的时候 需要对网络进行剪枝 普通卷积倒没问题 涉及到组卷积通道的裁剪就对应不上 当时没时间钻研 现在再看pytorch 钻研了一下 仔细研究了一下卷积的weight.data的存储 1.搭建网络 这里先随便搭建一下网络 放几个深度可分离卷积和普通卷积 import torc ......
卷积 深度 参数 Pytorch 方式

Transformer网络-Self-attention is all your need

一、Transformer Transformer最开始用于机器翻译任务,其架构是seq2seq的编码器解码器架构。其核心是自注意力机制: 每个输入都可以看到全局信息,从而缓解RNN的长期依赖问题。 输入: (待学习的)输入词嵌入 + 位置编码(相对位置) 编码器结构: 6层编码器: 一层编码器 = ......

TensorFlow 卷积神经网络实用指南:1~5

原文:Hands-On Convolutional Neural Networks with TensorFlow 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 深度学习 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 不要担心自己的形象,只关心如何实现目标 ......
卷积 神经网络 TensorFlow 神经 指南

深度学习快速参考:11~13

原文:Deep Learning Quick Reference 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 深度学习 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 不要担心自己的形象,只关心如何实现目标。——《原则》,生活原则 2.3.c 十一、训练 ......
深度 11 13

深度学习快速参考:1~5

原文:Deep Learning Quick Reference 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 深度学习 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 不要担心自己的形象,只关心如何实现目标。——《原则》,生活原则 2.3.c 一、深度学习 ......
深度

TensorFlow 深度学习实战指南:1~5 全

原文:Hands-on Deep Learning with TensorFlow 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 深度学习 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 不要担心自己的形象,只关心如何实现目标。——《原则》,生活原则 2.3 ......
TensorFlow 实战 深度 指南

JS 获取电脑本地IP 和 电脑网络IP(外网IP|公网IP)

1、JS 获取电脑本地的IP地址(内网) function getIP(callback) { let recode = {}; let RTCPeerConnection = window.RTCPeerConnection || window.mozRTCPeerConnection || wi ......
电脑 电脑网络 网络 JS IP

网络编程记录

IP数据报在传输的过程中虽然是先发送到路由器,再由他转发个目的主机,但是其头部的目标IP地址确实最终的目标主机的IP地址,而不是中转路由器的IP地址。说明IP头部的源端IP地址和目的端IP地址在转发过程中是始终不变的,但帧头部的源端物理地址和目的端物理地址在转发过程中是一直变化的 TCP传输的数据大 ......
网络编程 网络

Android开发,使用的是OkHttp和Reftrofit,用的是Kotlin协程,用Kotlin写一个网络拦截器,模拟登录请求,成功后返回成功模拟数据,失败后返回错误数据

首先,我们需要定义一个网络拦截器类,继承自OkHttp的Interceptor接口: class LoginInterceptor : Interceptor { override fun intercept(chain: Interceptor.Chain): Response { // 模拟登录 ......
数据 Kotlin Reftrofit 错误 Android

尝试学习训练一个GPT-2对话模型

一、GPT模型的背景知识 GPT-1基础原理: https://www.cnblogs.com/LittleHann/p/17303550.html 原始论文及相关文章: https://d4mucfpksywv.cloudfront.net/better-language-models/langu ......
模型 GPT

在有限 computational budget 下,借助 low-fidelity 模型提高精度

motivation:一些预算用于训 low-fidelity model,剩下预算用于 Monte Carlo 模拟,以得到结果。数学证明:近似 + 递推或迭代或归纳法。总结:目前看来,对我的工作意义不大。 ......

网络设备安全审核策略配置

配置日志服务器和防火墙设备,将防火墙的日志发送到日志服务器,并使用Splunk分析、管理防火墙日志 网络拓扑图 网络角色功能与版本 LOG:日志服务器,ubuntu 20.04 server FW:防火墙,asav 9.17 Other:控制Splunk web端,win 10 步骤 1、LOG开启 ......
网络设备 策略 设备 网络

[深度学习]服务器推送信息到手机

效果 原理 微信服务号是可以推送模板类消息到个人账号的,gpu服务器在训练的时候,把重要信息通过post请求发到服务号的服务器,然后以模板消息推送给微信。但只有企业或者个人经营企业才能注册服务号,所以我使用第三方的服务。一个是autoDL的推送,一个是server酱。本来以为不在autoDL机房里的 ......
深度 服务器 手机 信息

网络编程-包过滤防火墙简单实现

一、netfilter框架 这次实验使用netfilter框架,参考《网络编程》相关知识以及样例代码。 Netfilter是 Linux 内核中的一个框架,它为以定制处理器形式实施的各种网络相关操作提供了灵活性。Netfilter提供数据包过滤、网络地址翻译和端口翻译的各种选项。 检查点 在netf ......
网络编程 防火墙 网络

网络数据推送

一、通用数据推送代码 下面是优化后的代码: private async Task<string> PostResponse(string url, string postDataStr, string accessToken) { string htmlUrl = url + (string.IsN ......
数据 网络

跟姥爷深度学习2 TensorFlow的基本用法

一、前言 前面我们浅用TensorFlow做了个天气预测,虽然效果不咋样,但算是将整个流程跑通了。这一篇我们在之前基础上对TensorFlow的一些参数进行简单介绍,在接口文件的基础上了解各参数的简单含义和用法。 二、再次构建模型 我们先将之前的冗余代码都删除,做个简单的模型训练和预测。 三、可以修 ......
姥爷 TensorFlow 深度

跟姥爷深度学习1 浅用tensorflow做个天气预测

一、前言 最近人工智能、深度学习又火了,我感觉还是有必要研究一下。三年前浅学了一下原理没深入研究框架,三年后感觉各种框架都成熟了,现成的教程也丰富了,所以我继续边学边写。原教程链接: https://www.bilibili.com/video/BV1CW4y1r7Q7?p=1&vd_source= ......
姥爷 tensorflow 深度 天气

语言模型与语法树

week1 语言模型与语法树 基于规则的语言模型 import random def adj(): ###随机选取一个 return random.choice('蓝色的 | 好看的 | 小小的'.split('|')).split()[0] def adj_star(): ####返回一个adj( ......
语法 模型 语言

linux网络开发者定位问题常用工具和命令总结

本文章来自我的微信个人技术公众号 网络技术修炼,公众号中总结普及网络基础知识,包括基础原理、网络方案、开发经验和问题定位案例等,欢迎关注。 Linux网络开发者面临的问题往往比较复杂,因此需要使用一些工具和命令来进行定位和解决。在本篇博客中,我将总结一些常用的Linux网络开发者工具和命令,包括网络 ......
常用工具 开发者 命令 常用 工具

4.深度学习计算机视觉概述

深度学习计算机视觉方法概述 概述 深度学习已经成为计算机视觉领域的一个热门研究方向,被广泛用于图像分类、目标检测、人脸识别等任务中。与传统方法相比,深度学习方法可以通过端到端的学习,从原始数据中直接学习任务所需的特征表示,无需手工设计复杂的特征提取算法。 在深度学习计算机视觉领域,最常使用的神经网络 ......
深度 视觉 计算机

计算机网络

计算机网络是利用通信线路和通信设备将分布在不同地点的具有独立功能的计算机系统**(节点)连接起来,在通信协议和网络软件的支持下实现数据通信和资源共享**的系统 计算机网络的功能 共享资源 硬件资源 软件资源 数据资源 数据通信 分布式数据处理 计算机网络的分类 按覆盖范围分 个人网 局域网 城域网 ......
计算机网络

JS 实现网络测速

JS 实现网络测速 一、背景知识 在日常生活中,有时候感觉网络卡,就想测一下网速是多少(明知道卡,但是还是想看看是否真的卡,害)。这时候我们可能会打开测速网 - 专业测网速, 网速测试, 宽带提速, 游戏测速, 直播测速, 5G测速, 物联网监测 - SpeedTest.cn,但是我们可以用 JS ......
网络 JS

【计算机网络-数据链路层】广域网(WAN)

1 广域网的概念 广域网(Wide Area Network,WAN),又称外网、公网。是连接不同地区局域网或城域网计算机通信的远程网。通常跨接很大的物理范围,所覆盖的范围从几十公里到几千公里,它能连接多个地区、城市和国家,或横跨几个洲并能提供远距离通信,形成国际性的远程网络。广域网的通信子网主要使 ......
广域网 链路 计算机网络 数据 WAN

重装系统时的没有无线网络适配器的问题

1.问题描述 不显示无线网络的适配器,只有如下的两个,一个有线网络的适配器,一个蓝牙连接 2.方法尝试 推荐文章:https://cloud.tencent.com/developer/article/2100175 一些方法说明 第一种方法:设置网络重启 成功次数较多的方法:以管理员的身份打开 C ......
适配器 无线网络 无线 问题 系统

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型

https://github.com/THUDM/ChatGLM-6B ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别 ......
双语 中英 模型 ChatGLM 语言

计算机网络基础

计算机网络体系结构分为3种:OSI体系结构、tcp/ip体系结构、五层体系结构。 OSI体系结构:概念清楚 & 理念完整,但复杂 & 不实用 TCP/IP体系结构:含了一系列构成互联网基础的网络协议,是internet的核心协议 & 被广泛应用于局域网和广域网 五层体系结构:融合了OSI与TCP/I ......
网络基础 计算机 基础 网络

铺展自己的网络

跟别人说起时,总觉得大概不怎么容易被理解。 工作有输出,想着能有一个稳定的工作环境。一直没怎么找到有什么方法可以达到。后来在工作的时候,看到工作里的事情,发现,其实只要铺开一个很大的网络,就可以有稳定的输出环境。 工作的场景是为一些地方提供硬件支持,这种设备在全国很多地区都可以用。找到客户之后,维护 ......
网络