期刊名称:人工智能 创刊时间:2017年12月 主管单位:工业和信息化部 主办单位:中国电子信息产业发展研究院、赛迪工业和信息化研究院(集团)有限公司 刊期:双月刊 国内统一连续出版物号:CN 10-1530/TP 国际标准连续出版物号:ISSN 2096-5036 邮发代号:80-381 电话:010-88558766 邮箱:aiview@ccidmedia.com
人工智能技术的快速发展引领了第四科学研究范式—“智能科学”的发展。在该人工智能驱动科学研究的新范式下,计算机能够利用海量数据,通过机器学习、深度学习等算法,达到自主学习和推理的类人智能水平(如ChatGPT、AlphaFold等人工智能技术),为科学研究中数据、模型和实验等多个方面提供了显著助益。在新范式下,诞生了一大批新的科学模型,取代了传统的经典科学模型表示方法,通过构建基于数据-知识耦合驱动的人工智能分析机制,形成了一系列深度学习增强的复合式科学模型,有望带来更多的科学突破和创新。结合“智能科学”科学研究新范式,科学研究中实验数据、计算模型和科学实验等方面的效率能够大幅提升,科学家能够高效完成研究命题设想、研究方案设计和实验仿真验证,以获得科学结论并推动科学发展。
深度学习框架及AI芯片作为人工智能的基础设施,促进着人工智能的高速发展,为各行业在人工智能产业落地上发挥着至关重要的作用。在AI芯片多样化、深度学习框架多样化的人工智能生态下,如何发挥AI芯片高效计算性能变得极其重要。本文提出了MSAdapter,一款面向异构AI算力的深度学习代码高效转换工具。它以分层解耦的思路设计了前后端分离式整体架构,前端以PyTorch接口为标准,后端封装了MindSpore实现,在不改变用户框架使用习惯的情况下,解决了从Py Torch代码到MindSpore代码的转换,辅助用户获得深度学习框架最佳匹配的AI芯片算力。
<正>2012年以来,以深度学习为代表的人工智能技术持续突破,如深度卷积神经网络在图像识别、检测等计算机视觉任务中大放异彩,深度强化学习在围棋、扑克等游戏中战胜人类专家,ChatGPT的出现又使深度学习呈现通用智能水平。人工智能的发展引发了技术和产业的革命,极大地提高人类的生产效率。
近年来,得益于深度生成模型的发展,以Deepfake为代表的人脸深度伪造技术在互联网快速流行,受到了学术界和工业界的广泛重视。人脸深度伪造技术很容易被不法分子恶意使用,用来制作色情电影、虚假新闻,甚至被用于政要人物制造政治谣言等,这给国家安全和社会稳定都带来了极大的潜在威胁。为了降低深度伪造人脸视频所带来的负面影响,一系列深度伪造防御方法被提出。然而,由于数据集分布形式单一、评价标准不一致、主动性不足等问题,使得防御技术在走向实用的道路上仍有很长一段距离。本文将对深度伪造防御的相关研究工作进行科学系统的总结与归纳,并对现有技术的局限性做简要分析。最后,本文将探讨人脸深度伪造防御技术的潜在挑战与发展方向,为未来的研究工作提供借鉴。
随着深度学习的快速发展,深度神经网络模型在计算机视觉、自然语言处理等多个领域大放异彩,但性能变强的同时,也伴随着模型规模的快速增长。应用大规模模型往往需要强大的计算力和足够的存储空间。为了使深度模型能够在资源受限的条件下高效运行,模型压缩技术应运而生。本文介绍了深度学习中模型压缩技术的相关背景,在此基础上简要介绍了一些代表性的模型压缩技术,包括网络剪枝、知识蒸馏、模型量化,以及神经结构搜索,并展望模型压缩技术在未来的发展前景。
以GPT-4为代表的大语言模型(Large Language Model,LLM)展现出了惊人的通用智能潜力,基于相关技术,一系列大语言模型相继诞生。在这场技术变革中,一方面是巨大的参数量和计算量要求,另一方面是大量的使用需求和有限的算力资源支撑。如何使得其高效、低成本地规模性推广成为LLM更大范围落地的关键。本文围绕压缩、推理和评测三个角度,介绍相关大模型压缩技术和分布式推理技术,以及大模型在应用中的效果评估方式,探讨大语言模型时代的落地方法论,并对未来发展进行展望,期待推动大语言模型在各行各业的广大范围的应用和推广。
现阶段一维卷积神经网络诊断领域通常需要大量的数据支持,本文更为关注使用小样本数据获得更好的效果,同时还兼顾模型的适应能力。因此,本文模型致力于摆脱轴承故障诊断对大量数据的依赖性,提出了一种基于多尺度卷积胶囊网络和双向长短期记忆网络的滚动轴承故障诊断模型。本文利用双向长短期记忆网络对特征进行去噪,利用多尺度卷积神经网络充分提取特征,训练样本不足的故障诊断由胶囊网络完成。通过对比实验以及对不同工作环境下的轴承数据进行分析,验证了所提方法的可行性与有效性。与现有模型相比,在不同工况下,BiMCCN模型平均提高了18.71%的准确率。实验结果表明:该模型有着更高的准确率,以及更能适应多变的环境。
工业互联网通过人机物的深度连接,实现生产全要素、全产业链、全价值链的高效互联与协同,推动制造业生产方式和企业形态根本性变革,在经济社会发展中起到了重要的推动作用。然而,工业互联网内外网的连接不可避免地暴露了工业系统的脆弱性,加剧了被恶意攻击者入侵的风险,面临重大安全威胁。近年来,国内外高度重视工业互联网安全,开展了大量的入侵检测理论和技术研究,其中最具代表性的是基于机器学习的入侵检测方法,尤其是深度学习的方法,此类方法不仅能够降低误报率、提高检测率和适应性,而且能够提升对零日攻击的检测。本文面向工业互联网安全问题,从近年来工业互联网的安全事件入手,围绕工业互联网入侵检测,重点介绍了深度学习技术在工业互联网入侵检测中的应用,梳理了当前基于深度学习的工业互联网入侵检测理论和技术的最新研究进展,总结了未来基于深度学习的入侵检测方法的发展方向。
基于作者在人工智能领域,尤其是深度学习框架和平台的建设方向多年的理论和实践积累,本文对深度学习技术在产业应用的关键问题进行分析,介绍深度学习框架和平台在产业应用中所起到的核心作用和需要的关键技术,并总结以深度学习框架为核心的生态建设过程中的实践经验,基于我国深度学习产业现状,简述深度学习的关键标准与内容。
体能训练是提高消防员战斗力的重要途径之一,特别是对长时间处于灭火救援工作一线的消防员而言,体能训练的质量直接影响消防单位的整体战斗力。由于体能训练标准严格,受训消防员数量远超教员数量,针对消防员力量的体能训练不够充分。本文基于机器学习算法设计了消防体能训练识别系统,可以实现多种体能动作实时姿势的自动分类及计数功能。本文将体能训练问题转化为计算机视觉领域的人体姿态识别研究,利用Blaze Pose模型与KNN算法结合构建体能识别模型,通过提取关键点特征向量进行动作二分类,以实现动作计数功能;通过PCA降维实现体能多分类,模型准确率最高可达到98.19%,分类结果稳定可靠。
近年来,深度学习模型在计算机视觉、自然语言处理等领域的表现取得了长足的发展和巨大的进步,但与之俱来的是复杂的网络结构和庞大的参数数量,其高昂的运算和存储成本限制了深度学习在实际应用中的部署。虽然模型轻量化方法有效地减少了模型的体积与运算,但仍面临新的挑战。本文总结了目前主流的五种深度学习模型轻量化方法,深度分析模型轻量化方法在学术界与工业界目前面临的挑战。最后,本文在前沿研究成果的基础上对未来的工作加以展望。