语义通信论文阅读(2):Semantic Communications: Overview, Open Issues, and Future Research Directions

发布时间 2023-04-09 22:06:26作者: 房同森

图片名称

语义通信:概述、开放问题和未来研究方向

文章刊源:IEEE Wireless Communication(1区,IF=11.457)
发表年份:2022
文章概要:和前面的文章一样,这篇也是一篇综述型文章,作者定义了一个较为完整的语义通信结构,并且主要归纳了当前语义通信研究的问题与不足,以及总结了未来语义通信的发展方向,文章中理解的语义通信为知识型驱动的通信知识,并提出了一个基于DL的端到端语义通信基本架构。

目前的通信技术已经通过先进的编码和调制技术逼近Shannon物理容量极限。而语义通信不再是单纯的传输比特流,其核心是在发送端提取发送信息的"意义",并借助发送端和接收端之间的匹配知识库( KB ),在接收端成功"解释"语义信息。所以语义通信本质上是一种基于人工智能的通信方案

引言

5G使用了非常多的无线通信技术,例如:

  1. 非正交多址接入NOMA (Non-Orthgonal Multiple Access)
    NOMA不同于传统的正交传输,在发送端采用非正交发送,主动引入干扰信息,在接收端通过串行干扰删除技术实现正确解调。基本思想是利用复杂的接收机设计来换取更高的频谱效率。

注意:NOMA的子信道依然采用正交频分复用技术OFDM,也就是说子信道是正交的,但是一个子信道不再只分给一个用户,同一个子信道上不同用户是非正交传输。所以产生了干扰,这时候接受端就需要串行干扰技术(SIC)来实现多用户检测。

  1. 大规模输入输出MIMO (Multiple-Input Multiple-Out-put)
    MIMO技术属于多天线技术,利用空间分集/复用来提高吞吐量,多个独立的的数据流同时传输。其基本原理是在发射端和接收端分别使用多个发射天线和接收天线,并能够区分发往或来自不同空间方位的信号,还可以在不增加带宽与发射功率的前提下,提高系统容量、覆盖范围和信噪比、改善无线信号的传送质量.

尽管5G能够以低时延和高数据速率满足不同业务的大部分需求,但现有的技术可能无法支持超5G ( B5G )通信中的许多智能应用,例如脑机交互、VR、AR等。
语义通信作为一种智能通信方案被提出,它关注传输消息的意义而不是精确的比特流传输。即使在接收者处解释的单词短语发生了一点点变化,接收者仍然可以理解。此外,当带宽有限或信噪比较低时,语义通信系统可能仍然表现良好,并且可能消耗更少的能量。

端到端语义通信

来看一个通用的基于DL的语义通信模型:

基于深度学习的语义通信模型

整体分为三个部分:语义Encoder-Decoder、信道Encoder-Decoder、发送端和接收端各自的Knowledge Base。

  • 左侧为发送端,右侧为接受端。其中发送端的Encoder和接受端的Decoder由DNNs实现。Encoder基于其KB提取消息的语义信息。Decoder收到消息后,能够根据目的地KB对发送消息的含义进行解读和推断。
  • 图中的红线表示在给定静态信源、信宿KB、通信环境下,采用随机梯度下降(SGD)联合训练语义编解码器、信道编解码器。DNN具有泛化性,即使一条消息之前没有出现过,也可以被成功编解码。但是当发送的消息与当前的KB类型不同时,必须要重新训练语义编解码器。由于信道状态是时刻变化的,知识库也是需要扩展和更新的,所以迁移学习是一种比较有效的训练编解码器的方法。
  • 图中的黄色表示动态的通信环境下Encoder和Decoder的训练过程。如果通信环境发生变化,则需要使用新的信道模型重新训练信道Encoder-Decoder,而语义编码器和解码器的参数保持不变。
  • 图中的蓝色表示动态的通信环境下KB的更新过程。如果语义源和目的节点通过学习和共享来更新其KB,则需要在给定信道Encoder-Decoder参数的情况下,基于新的KB重新训练语义Encoder-Decoder。

文本传输

保持两个单词之间语义相似性的一个直观方法是为它们分配相似下标。

有点像word2vec,每个词映射为一个向量,可用来表示词对词之间的关系,相近的词会靠得很近。

举个例子:"car"编码为"0010","automobile"编码为"0000"。尽管信道中有噪声和干扰,接受端重建的单词也会和发送端的单词具有很高的语义相似性。

受DNNs在NLP领域成功的启发,Farsad提出了一种基于文本语义通信的JSCC方案,其中编码器和解码器由两个RNN实现。
H. Xie提出了一种新的语义通信系统框架,旨在设计联合语义信源和信道编码方案,同时最大化系统容量。由于基于Transformer和自注意力机制,接受端可以很容易地理解长句。后来作者提出了DeepSC,为了使DeepSC适用于各种通信场景,采用深度迁移学习加速模型再训练。通过重新训练的模型,DeepSC可以识别各种知识输入,并从失真中恢复语义信息。

未完待续...