信息学奥赛基础理论知识

发布时间 2023-10-13 19:47:07作者: 偰死你

⦁ 信息学奥赛简介:

NOIP:全国青少年信息学奥林匹克联赛是教育部认可的五大学科(数学,物理,化学,生物,信息学)竞赛之一,由1984中国计算机学会(CCF)创办,联赛分为普及组和提高组。复赛可以使用c,c++,Pascal语言,2022年后只能使用c++。
CSP-J/S:2019年CCF推出CSP(软件能力认证),CSP-J/S(非专业级别认证),CSP-J对应NOIP中普及组,CSP-S对应NOIP中提高组。CSP-J/S中分为初赛和复赛,初赛为笔试,复赛为上机编程,CSP-S已经成为NOIP的选拔性考试。
NOI:全国青少年信息学奥林匹克竞赛,官网地址:http://www.noi.cn,参加该比赛的代表了省级的最高水平。
APIO/IOI:比NOI更高一级,APIO是亚洲与太平洋地区信息学奥林匹克竞赛,IOI是国际信息学奥林匹克竞赛。

⦁ 计算机硬件基础

  1. 计算机的发展史

1946年第一代电子管计算机(诞生于美国宾夕法尼亚大学),以cpu为中心,使用计算机语言,速度慢,存储量小,主要用于数值计算。
-》1958年第二代晶体管计算机,以存储器为中心,使用高级语言,应用范围扩大到数据处理和工业控制。
-》1964年第三代中小规模集成电路计算机,以存储器为中心,增加了多种外部设备,文字图像处理功能加强。
-》1971年第四代大规模和超大规模集成电路计算机,应用更广泛,核心软件集成在一个或多个芯片上,从而出现了微型计算机。

  1. 计算机硬件
    计算机系统分为计算机硬件和软件系统两大部分。

冯·诺依曼体系:匈牙利著名数学家,提出计算机三个基本原则,采用二进制逻辑,程序存储执行以及计算机由五个部分组成(运算器,控制器,存储器,输入设备,输出设备)。
奖项:冯·诺依曼奖章 。

图灵奖:纪念英国著名数学家,人工智能之父阿兰·麦席森·图灵由美国计算机协会(ACM) 设立,一年给予一位=。

运算器:由算术逻辑单元(ALU),累加器,状态寄存器,通用寄存器组成,CPU构成主要 器件

控制器:计算机的控制中心,CPU构成主要器件。

中央处理器(CPU)由运算器和控制器组成,生产计算机CPU的厂商有英特尔(Inter) 和AMD,英特尔的CPU型号主要有赛扬系列,奔腾系列,酷睿i3,i5,i7。

手机领域生产CPU的厂商主要有高通,德州仪器,三星,联发科(MTK),华为海思, 华为麒麟,苹果等

摩尔定律:集成电路上可以容纳的晶体管数目在大约每经过24个月便会增加一倍。 也就是说,处理器的性能每隔两年翻一倍。

存储器:计算器中的记忆设备,用来存放程序与数据,分为内存储器与外存储器,内存储器 一般是指内存,也称主存,负责连接外存与CPU,计算机所有程序的运行都是在内存 中进行的。

除内存外,内存处理器还包含随机存储器(RAM),只读存储器(ROM)和高速缓存 (CACHE)。

随机存储器:数据可读可写,断电数据丢失。

只读存储器:数据可读,数据一旦存入不更改,断电数据不丢失。

高速缓存:内存条重要技术指标,读写速度影响计算机的性能,真正位于CPU与 内存之间的器件,读写速度比内存还快。

外存储器指计算机内存及CPU缓存以外的存储器,断电仍能保存数据。例如:机械硬 盘,固态硬盘,光盘,U盘,软盘,磁带。

输入设备:计算机输入数据和信息的设备。计算机与用户或其他设备通信的桥梁。常见的输 入设备有数位板,键盘,鼠标,扫描仪,麦克风,摄像头,游戏控制杆。

输出设备:计算机终端设备,用于接收计算机数据的输出显示,打印,声音,控制外部设备操作,常见的输入设备有音响,显示器,打印机等。

  1. 数制与编码
    计算机内部的存储都是采用二进制方式进行存储的。
    计算机的存储单位:
    最小单位称为位(比特),简写为b(bit)。
    最基本的单位称为字节,简写为(B)。
    不同单位之间的换算关系如下:
    1B=8b
    1KB=1024B=2^10B
    1MB=1024KB=2^10KB
    1GB=1024MB=2^10MB
    1TB=1024GB
    1PB=1024TB
    1EB=1024PB
    1ZB=1024EB
    数制标识符:
    数制 二进制 八进制 十进制 十六进制
    标识符 B O D H
    数制换算关系:
    十进制逢十进一
    八进制逢八进一
    二进制逢二进一
    十六进制逢十六进一
    3.1二进制与十进制的转换:
    十转二:
    如45.125
    整数除以2取余 反序读取
    小数乘2取整 正序
    结果为:101101.001
    二转十:
    以小数点为起点,小数点左边第一位为2的0次方以此向左向右累加累减。
    3.2二进制与八进制的转换:
    以三位二进制为一组,求出每组的八进制:

3.3 二进制与十六进制的转换:
以四位二进制为一组,求出每组的十六进制:

3.4 ASCLL编码
全称:美国信息交换标准代码,基于拉丁字母的计算机编码系统,总共有128个字符,ascll编码用1个字节来存储,最高位默认为0,实际使用位字节后7位。
3.5 汉字编码
汉字编码分为外码,交换码,机内码和字形码。外码指的是输入码,用于将汉字输入计算机内的一组键盘符号,常见的有拼音码,五笔字型码等;交换码是指不同的具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准;机内码是指计算机内部存储,处理加工和传输汉字时所用的由符号0和1组成的代码;字形码是点阵代码的一种,是为了将汉字在显示器或打印机上进行输出,把汉字按图形符号设计成点阵图。
我国汉字编码的标准是GB2312字符集,也称为国际码,由两个字节组成的且两个字节的最高位都为1,收录汉字6763个。

3.6 原码,反码,补码
在二进制的编码过程中分为原码,反码,补码。
原码是计算机对数字二进制定点表示方法。原码表示法在数值前面增加了符号位(即最高位为符号位):0代表正,1代表负。原码在计算机内部不能直接进行计算。
反码是数值存储的一种,多应用于系统环境设置。
补码是计算机中数字存储的常用形式。原码和反码在计算过程中会出现错误。
由原码求反码规则:
正数的反码与其原码相同;负数的反码则是对数值逐位取反,符号位保持1。

由原码求补码规则:
原码为正,补码与原码相同;原码为负,在反码的基础上加1。

3.7 位运算
位运算分为位逻辑运算与移位运算(对应二进制位):
含义 C++语言表示 规则
与运算 a&b 都为1时为1,反之为0。
或运算 a|b 两个数其中一个为1就为1,反之为0。
异或运算 a^b 两个数不同时结果为1,反之为0。
取反运算 ~a 对数值进行取反。
左移运算 a<<b 左移b位乘以2的b次幂。(二进制数向左移动b位,高位丢弃,在后面添b个0)
右移运算(带符号运算) a>>b 右移b位除以2的b次幂(取整);(二进制数右移b位,去掉末b位);对于有符号的,在右移时,符号位随之移动;为正数时,最高位补0;为负数时,符号位为1,最高位时补0或是1取决于编译系统。
注:在逻辑运算中,数学表示符于编程逻辑的对应关系为:
∧表示与
∨表示或
¬表示非
3.8 多媒体文件的数字化
图像在计算机中存储方式有两种:位图和矢量图。
位图通过存储像素点得方式来描述的,矢量图则是一系列指令的集合。
不同点 位图 矢量图
描述方式 像素 指令集合
存储空间 大 小
色彩效果 丰富 单调
缩放效果 放大后无限倍后失真 不失真
图像的数字化主要指的就是位图的数字化,将像素所表现出来的色彩使用二进制的形式记录出来,因此每一个像素点需要用n位二进制来表示。
例如:
视频的数字化实质上是在图像数字化的基础上加上时间参数,所以视频数字化存储空间占用计算公式为:
像素色彩二进制
声音的数字化则需要考虑采样频率与采样位数的限制,通过每个一段时间读取波形种的一个数据点,再将数据点进行量化(转为二进制)便可以计算声音的存储空间,计算公式如下:
声音存储容量=采样频率量化位数声道数*时间
⦁ 操作系统与应用软件

  1. DOS操作系统
    DOS(磁盘操作系统)是早期个人计算机山使用最为广泛地操作系统。Windows系统中仍保留了MS-DOS。
    MS-DOS采用模块结构,它由五部分组成:ROM中的BIOS模块,IO.SYS模块,COMMAND.COM模块,MSDOS.SYS模块以及引导程序。
    DOS常用的内部命令有:
    命令 含义
    dir 显示指定路径上所有文件或目录的信息,格式:dir[盘符][路径][文件名][参数]
    md 建立目录;格式:md[盘符:][路径]
    cd 进入指定目录;格式:cd[路径]
    rd 删除目录;格式:rd[盘符][路径]
    copy 拷贝文件;格式:copy[源目录或文件][目的目录或文件]
    del 删除文件;格式:del[盘符][路径][文件名][参数]
    ren 更改名字;格式:ren[原名][现名]
    type 显示文本文件;格式:type[文件名]
    cls 清屏;格式: cls
    DOS外部命令实质上是一些应用程序,是以文件形式存在的可执行文件。
    DOS常用的外部命令有:
    命令 含义
    format 格式化命令;格式:format[盘符][参数]
    xcopy 拷贝命令;格式:xcopy[源路径][源目录/文件名][目的目录/文件名][参数]
    chkdsk 磁盘检查命令;格式:chkdsk[盘符][参数]
    move 文件移动命令;格式:move[源文件][目的路径]
  2. Windows操作系统及软件
    Windows操作系统是1985年美国微软公司研发的操作系统,分为32位和64位。微软开发的软件包含:office系列办公软件,word,PowerPoint,Excel,access等,在Windows操作系统中可执行文件是以.exe为扩展名。
  3. Linux操作系统
    Linux全称为GNU/Linux,是一种免费使用和自由传播的类UNIX操作系统,其内核由林纳斯▪本纳第克特▪托瓦兹于1991年10月5号首次发布,是一个多用户,多任务,支持多线程核多CPU的操作系统。支持32位和64位硬件。
    使用Linux内核的操作系统有Ubuntu,CentOS,Red Hat等。
    Linux基本思想:一切都是文件;每个文件都有确定的用途。
    常用命令:cd(进入某个文件夹);ls(列出目录内容);chmod(更改文件权限);
    cp(复制); rm(删除);kill(终止某个进程);ps(查看服务状态)。
    ⦁ 计算机网络基础
  4. 计算机网络组成
    计算机网络由网络硬件和网络软件组成。
    网络硬件包括网络服务器,网路工作站,传输介质和设备等。
    常见的有线传输介质:同轴电缆,双绞线(日常所见的网络有线传输介质,俗称网线),光纤。
    常见的网络设备有集线器,交换机,路由器(路由器可以连接不同局域网的设备)等。
    网络软件一般是指系统的网络操作系统,网络通信协议和应用级的提供网络服务功能的专用软件。其中通信协议是不同网络设备生产厂商必须遵循的统一规定。这样才能实现不同设备之间的互相通信。
    计算机网络大都按层次结构模型去组织计算机网络协议。国际标准化组织(ISO)建议的“开放系统互连”(OSI)基本参考模型由7层组成,物理层,数据链路层,网络层,运输层,会话层,表示层和应用层。通信流程为:
    系统A 系统B 功能
    应用层 应用层 在网络应用程序之间传递信息
    表示层 表示层 处理文本格式化显示代码转换
    会话层 会话层 建立,维持,协调通信
    传输层 传输层 确保数据正确发送
    网络层 网络层 决定传输路由,处理信息传递
    数据链路层 数据链路层 编码,编址,传输
    物理层 物理层 管理硬件连接
    而在通常使用过程中,所配置的往往是TCP/IP模型。
    TCP/IP(传输控制协议/网际协议)是指能够在多个不同网络间实现信息传输的协议簇,是指由FTP,SMTP,TCP,UDP,IP等协议构成的协议簇。
    OSI与TCP/IP模型关系:
    应用层 应用层 面向用户 简单邮件传输协议(SMTP),超文本传输协议(HTTP),网络终端协议(TELNET),文件传输协议(FTP),域名解析协议(DNS),简单网络管理协议(SNMP)
    表示层
    会话层
    传输层 传输层 面向数据传输 传输控制协议(TCP),用户数据报协议(UDP)
    网络层 网络层 网际协议(IP)
    数据链路层 网络接口层 底层网络协议
    物理层
    OSI7层模型 TCP/IP模型 TCP/IP模型每层主要协议
    面向用户的协议是指能够直接为应用进程(程序)提供服务的;面向数据传输的协议都是为应用进程服务的,用户看不到,所以也被称为“透明的”。
    应用层中关于邮件传输的协议主要有3种,分别是POP3,SMTP和IMAP。
    POP3(邮局协议第三版)规定怎样将个人计算机连接到Internet的邮件服务器和下载电子邮件的电子协议;
    SMTP(简单邮件传输协议)帮助每台计算机在发送或中转邮件时找到下一个目的地;
    IMAP(交互式邮件存取协议)的作用是使在电子邮件客户端收取的邮件仍然保留在服务器上,同时在客户端上的操作都会反馈到服务器上。

传输层上主要有2个协议:TCP和UDP协议。
TCP协议负责控制应用层包含所在的2台计算机之间的数据传输,保证数据能可靠地,无差错地传输。
UDP协议尽最大努力交付,不能保证提供可靠的交付。

IP协议主要功能是路由选择,即为每个分组选择最佳的路径并把分组送到目的地。不同于TCP的是:IP是无连接的协议,每个分组都是单独发送的。

  1. 计算机网络类型
    计算机网络类型根据分类标准不同可以分为不同种类的计算机网络。
    根据网络拓扑结构划分:总线形,环形,星形,网状形和树形。
    总线形优点电缆长度短,布线,维护容易,便于扩充,总线中任一节点发 生故障都不会造成整个网络的瘫痪,可靠性高。缺点是故障诊断,隔离困 难,实时性不强。
    环形是使用公共电缆组成的一个封闭的环,各节点直接连到环上,信息沿着环按一定方向从一个节点传送到另一个节点。
    星形网络中的各节点通过点到点的方式连接到一个中央节点(又称中央转接站,一般是集线器或交换机)上,由该中央节点向目的节点传送信息。
    网状形具有较高的可靠性,但结构复杂,实现起来费用较高,不易管理和维护,不常用于局域网。
    树形包含分支,每个分支又包含多个节点,类似于总线形。
    根据通信距离可以分为局域网(LAN),城域网(MAN),广域网(WAN)。
    局域网:一般来说覆盖几千米范围内的网络。
    城域网:城市范围内的网络。
    广域网:不同地区互联且跨度非常大的网络。
    根据用途可以分为公用网络和专用网络。
    专用网:专门用于某一种用途。
    公用网:人人皆可进入。
  2. IP地址
    IP地址是由四个字节组成的,且两个字节之间用“.”分割,每个字节装换成十进制不能超过255(转换成二进制范围:00000000-11111111)。
    IP地址包含两部分:网络号以及主机号。
    IPv4(第四代IP网址),IPv6(第六代IP网址)。
    IP地址根据网络号的不同,可以分为5类:
    类别 范围 主机数
    A 1.0.0.0~127.255.255.255 2^24-2
    B 128.0.0.0~191.255.255.255 2^16-2
    C 192.0.0.0~223.255.255.255 2^8-2
    D 224.0.0.0~239.255.255.255 用户多点广播
    E 240.0.0.0~255.255.255.255 因特网保留使用

具有特殊意义的IP地址:
0.0.0.0表示一类不清楚目的的主机和目的网络的地址集合。
255.255.255.255是特殊广播地址,不能被路由转发。
127.0.0.1是本地测试地址。
169.254.x.x是DHCP故障地址。
私有网络地址:
类别 范围
A 10.0.0.0~10.255.255.255
B 127.16.0.0~172.31.255.255
C 192.168.0.0~192.168.255.255

  1. 网络安全
    网络安全主要分为两部分:硬件安全和软件安全。
    硬件安全:传输介质在通电过程中产生的电磁泄露等。
    软件安全:包括通过弱口令,用户权限等方法来窃取数据。
    常见的网络攻击包括中断(尝试中断用户间的通信),截获(截获用户通信内容),篡改(通信过程中篡改数据),伪造(编写假的内容发送),拒绝服务(以DDos攻击为代表的使请求方在访问服务器时产生拒绝服务),抵赖(发送者发送信息后否认自己发送过),恶意程序(包括病毒,蠕虫,木马等程序破坏系统或其他程序,数据)。
    防范这些攻击的常用手段:安装杀毒软件,设置防火墙(有效阻隔内网与外网)和加密文件。加密方法主要分为对称加密和非对称加密两种,区分是否对称需要看秘钥是保密的还是公开的,还可以使用MD5加密方法。