基于离线强化学习的自动协商方法
陈锶奇;熊钊远;汪云飞;王昊杨;自动协商是实现多智能体系统中合作与协作的关键方式。尽管基于强化学习(Reinforcement Learning, RL)的协商智能体在各种场景中取得了显著的成功,但由于实现环境的限制,它们仍面临挑战。特别是这些智能体需要与对手进行大量的在线互动以进行训练,这在现实世界的应用中往往是不可行和不现实的。因此,需要一种新的方法,以便直接从离线数据集中学习有效的协商策略。此外,在随后的在线协商中,对手可能会因为各种原因(如风险态度的变化或市场条件的变化)而改变其策略。这些因素为自动协商带来了重大挑战。提出了一种新的协商智能体,通过离线—在线RL来提高协商智能体的能力。它使协商智能体能够:(1)利用基于RL方法的策略与对手交互,提高动态协商环境的适应能力;(2)从历史离线数据中学习协商策略,无需大量的在线交互;(3)在在线微调优化过程中,使得学习到的策略快速且稳定地提升性能。基于多种协商场景和最近自动化协商智能体竞赛(Automated Negotiating Agents Competitions, ANAC)中的获胜智能体,提供了广泛的实验结果。结果显示,该智能体的表现超过了最先进的智能体,并且即使对手转换到不同策略时仍保持有效。
征文通知:智能无线传输和组网技术与应用
<正>随着5G-A、6G等前沿技术蓬勃发展,智能无线传输与组网已成为当下信息通信领域的关键驱动力,传统无线通信依赖固定的无线资源调度和网络配置方式,难以适应未来资源受限下物理层高效传输、超高密集的无线网络、高度异构的大规模节点自主组网的需求,特别是未来新技术的引入,例如6G提出的超大规模MIMO系统、天堂地异构网络融合等方面,相比较于现有通信系统,复杂度将会有显著的增加,尽管6G提出了支持Sub-6G、皂朱波、太赫兹、可见光、红外等金频段通信,但是由此带来的无线资源高效调度问题、异构网络深度融合问题也随之增加。人工智能技术的快速发展,为解决这一难题提供了新的解决思路,特别是“通信+Al”“大棋型”“具身智能”等新理念、新方法的提出,为无线传输与组网技术的发展与应用开辟了新空间,构建了智能无线通信的新范式,为6G万物智联的新时代奠定了坚实基础。
专题:面向新一代无线通信的多模一体化关键技术
施育鑫;毛天奇;鲁信金;林志;<正>内容导读近年来,无线通信覆盖的场景不断丰富,6G通信将有望拓展至太空、临空、中低空、陆地、海洋等立体广域空间,最终实现万物智联、全域覆盖的美好愿景。此外,随着用户需求的不断增加,无线通信在承载原有信息传输功能的同时,所需兼容和外延的功能亦不断拓展,新一代无线通信技术发展面临如下技术挑战:从通信网络自身角度来看,现有天、临、空、地、海异质网络间架构、协议差异性大,跨域互联互通难;从功能拓展角度来看,6G网络中的通信、感知、控制、计算等系统设计需求具有显著差异性,有限多维资源约束下存在无法避免的资源分配竞争性,导致多功能兼容融合极具挑战。
基于专利分析的6G天地一体化网络调制技术发展研究
王慧颖;许强;随着6G的快速发展,天地一体化信息网络成为实现全球无缝覆盖的关键。围绕6G天地一体化网络中的调制技术展开专利分析,重点研究了基于循环前缀(Cyclic Prefix, CP)/离散傅里叶变换(Discrete Fourier Transform, DFT)扩展的正交频分复用(Orthogonal Frequency Division Multiplexing, OFDM)、基于滤波器组/多带滤波的OFDM、正交啁啾分复用(Orthogonal Chirp Division Multiplexing, OCDM)、正交时频空间(Orthogonal Time Frequency and Space, OTFS)和仿射频分复用(Affine Frequency Division Multiplexing, AFDM)这5种调制技术的专利申请趋势、技术热点及竞争格局。研究结果表明,2020年后6G调制技术专利申请量激增,中国在专利数量上占据主导地位,AFDM因其在高动态信道中的优异性能成为未来6G标准的有力候选。揭示了专利领域的技术空白,为后续研发和专利布局提供了战略参考。
可重构智能表面的交替模式选择索引调制传输技术
杨攀;曾灿良;曹文涛;张挺;陈平平;可重构智能表面(Reconfigurable Intelligent Surface, RIS)在物理空间中智能操控电磁波传播路径,显著提升信号覆盖能力与通信效率,适用于复杂通信场景中障碍物遮挡区域的信号补盲。目前大多RIS融合索引调制(Index Modulation, IM)方案仍然受限于物理天线或RIS反射单元传输模式,如何有效结合RIS与IM技术成为无线通信领域的研究重点。为此,提出一种基于RIS的交替模式选择索引(RIS Alternate Mode Selection Index, RIS-AMSI)方案,通过动态切换RIS单元在2个时隙的激活模式,将模式交替顺序作为额外索引信息嵌入传输过程。同时,该方案设计了新型调制机制,利用RIS的信道增益特性,构建低复杂度的贪婪检测器实现高效的信息解调。通过理论推导和仿真实验,验证了方案理论误码率(Bit Error Rate, BER)分析的准确性。结果表明,与基准方案相比,所提方案在保持相近频谱效率的同时显著降低BER,为RIS与IM技术的融合提供了切实可行的新思路。
网站访问量
今日访问量: 43



