期刊名称:人工智能 创刊时间:2017年12月 主管单位:工业和信息化部 主办单位:中国电子信息产业发展研究院、赛迪工业和信息化研究院(集团)有限公司 刊期:双月刊 国内统一连续出版物号:CN 10-1530/TP 国际标准连续出版物号:ISSN 2096-5036 邮发代号:80-381 电话:010-88558766 邮箱:aiview@ccidmedia.com
<正>目前,我们正处于一个由数据、算法和计算资源共同驱动的新时代,以大模型为代表的人工智能技术正快速重塑我们的工作模式和日常生活。如果把人工智能比作一座高效工厂,那么海量数据就是原料,复杂算法就是发动机,强大的算力则为其提供源源不断的动力,从而实现了从简单的“智能工具”到具备广域认知能力的“类人智能”的转变。人工智能的思维推理能力不断增强,甚至在某些任务上表现出超出人类专家的能力,并且智能体技术使得人工智能具备一定的自主行为能力。人工智能正在从单纯的工具,慢慢变成一种新的生产主体。
大模型应用日渐广泛,这对大模型的可信可控可用提出了更高的要求。本文简要分析了当下大模型在这些方面存在的不足,并系统介绍了ChatBIT模型在可信可控可用方面所具备的优势。本文围绕大模型科学推理能力进行了一组对比实验,实验结果显示,在数学推理任务上,ChatBIT-7B取得了58.89分,这一分数显著高于DeepSeek-R1-7B的53.3分。这表明,ChatBIT能够以很小的参数量完成相对复杂的推理任务,为构建可信可控可用绿色大模型提供了可供参考的范式。
算法、数据和算力的协同发展推动着大模型技术的不断演进,同时也对国产大算力GPU提出更高的挑战。本文深度探析大模型技术爆炸式演进背后的算力需求,从模型架构创新、训练方法革新、推理技术优化等维度展开算力需求的影响分析,研究了大算力GPU面临的核心技术挑战,包括先进制程和软硬系统限制、基础软件设施不足、国产异构算力孤岛,以及生态体系建设低效等问题。以创新实践为例,提出了自主研发国产大算力GPU的破局之道与术,即通过硬件架构创新突破工程限制,自主基础软件平台建设突破生态困境,异构混训混推解决算力孤岛问题,并通过产学研实践以及与产业伙伴深度合作,共建自主可控生态。研究成果为推动国产化算力与大模型技术协同演进,推进人工智能产业的可持续发展提供了丰富的理论基础与切实可行的实践参考。
随着大模型参数量、训练数据量和多模态能力的指数级增长,GPU作为核心算力载体正面临架构、能效比、存储带宽等多维挑战。本文分析了大模型技术趋势,揭示其对GPU软硬件需求的变化,提出未来AI产业需要通过软硬件协同创新,探索高质量发展道路。
随着大模型技术的飞速发展,算法技术革新滞后与AI基础设施的不完善成为关键制约因素。本文聚焦DeepSeek在模型架构和基础设施层面的创新和实践,详细分析其取得低成本训练和高效率推理的原因所在,探索DeepSeek的相关技术构想和优化策略在国产GPU上的全栈优化实践,进一步解耦算法和算力系统。通过软硬件协同优化策略提升大模型的训练与推理效率,引入并适配独特的多头潜在注意力、混合专家架构等创新设计。结合开源生态建设和多维度优化策略,推动国产GPU在人工智能领域的应用场景探索,加速应用生态的快速构建,为国内的AI应用落地和发展提供新的思路和解决方案。
多模态能力作为通用人工智能大模型的核心发展方向,视觉感知与认知技术在其中占据基础性地位。本文系统梳理并回顾了多模态大模型及其视觉技术的演进脉络与研究现状,并分别从多模理解、图文识别、超拟人多模交互三个方面重点介绍了研究团队的技术进展。实践表明,相关技术已成功赋能机器人、智慧教育、人机交互等领域,推动了产品的智能化升级,已经形成了可推广的多模态技术与应用范式。展望未来,多模态视觉能力将沿细粒度跨模态对齐、具身智能交互、领域知识增强三大方向持续突破,通过与语言、语音等模态的深度融合,最终构建“感知-认知-行动”一体化的通用人工智能系统。
随着大型语言模型(LLM)的日益普及与应用深化,用户隐私泄露的风险正急剧上升。在LLM的训练及推理过程中,模型会广泛接触并可能存储大量的个人敏感信息。若这些信息被攻击者通过记忆提取、间接推断等手段恶意获取,将对用户隐私构成重大威胁。近年来,针对LLM隐私威胁的匿名化防护技术已成为人工智能领域的研究热点之一。该技术基于数据过滤、模糊化等策略,有效降低了隐私泄露风险。本文梳理了近年LLM隐私攻击领域的研究成果,涵盖后门攻击、成员推理攻击、数据提取攻击,以及提示注入攻击等关键技术;系统归纳了LLM匿名化防护的通用实施流程及相关技术进展;提出了针对当前技术不足的改进策略与未来研究方向。
目前,音频分离在信号处理领域得到了广泛的研究,但这些研究都只关注音频信息,忽略了与之相伴的视觉信息,造成了特征信息的丢失和浪费。现代社会中的信息呈现多模态趋势,为了更好地利用多模态信息实现音源分离任务,本文利用残差网络的ResNet-50变体网络和深层U-Net网络,并融合注意力机制构建视觉信息引导的音源分离模型VASMA。首先对有声视频进行分割得到视频帧和音频帧,将其分别传入视频分析模块和音频分析模块进行特征提取;其次把提取到的视觉特征和音频特征输入到特征融合模块;最后将得到的预测频谱图与真实频谱图进行定性比较,同时引入信号失真比SDR、信号干扰比SIR和信号伪影比SAR三个指标进行定量比较。本文模型在三个评价指标上的性能均有所提升,相比于其他模型,该模型在SDR指标上平均提升85.30%,SIR指标上平均提升70.34%,SAR指标上平均提升10.51%。最后的实验结果表明,相比之前的方法,本文模型在音源分离任务中实现了较优的效果。
近年来,生成式人工智能突飞猛进式的发展很容易让人联想到通用人工智能的实现。那么,远远超越人类智能水平之上,并且具有自我意识的超级智能真的要成为现实了吗?瓦洛尔在其新近著作《人工智能之镜》中表示,人工智能不仅是一种技术工具,更是一面“镜子”,通过其运作机制和局限性,能够反映出人类认知与实践的本质和边界。生成式人工智能依赖于数据驱动的模式识别与逻辑推理,但其缺乏人类的主观意识、情感和直觉等能力。由此,人类智能与生成式人工智能有着本质区别,各有其优势与独特性,也各自存在认知偏差和局限性。生成式人工智能不仅是社会变革的重要驱动力,也是人类自我反思的重要媒介。未来,人类和生成式人工智能应当在界定各自动态边界和功能的前提下开展深度融合与协作,以推动人机文明迈入崭新形态。
人工智能是人类发展新领域,人工智能技术的广泛应用对人类社会与文明走向产生了深远影响,全球人工智能治理成为攸关全人类命运的重要课题。全球人工智能治理倡议内涵丰富,意义深远,从当前国内外人工智能发展面临的机遇与风险并存的现实背景出发,以全球人工智能“发展观”“安全观”“治理观”为核心要义,系统阐释了人工智能治理的中国方案,为破解全球人工智能发展难题贡献了中国智慧,是中国在人工智能领域践行人类命运共同体理念的重要行动,对促进全球人工智能健康发展、实现全球人工智能安全有序与加快完善全球人工智能治理体系具有重要意义。