您的位置: 主页 > 动态 > 公司动态 >

人工智能生长概况:多媒体技术篇

本文摘要:多媒体技术 1 多媒体观点“多媒体”一词译自英文“Multimedia”,而该词又是由 multiple 和 media 复合而成,焦点词是媒体。媒体(medium)在盘算机领域有两种寄义:一是指存储信息的实体,如磁盘、光盘、磁带、半导体存储器等,中文常译为媒质;二是指通报信息的载体,如数字、文字、声音、图形和图像等,中文译作前言,多媒体技术中的媒体是指后者。其实,“媒体”的观点规模是相当广泛的。

乐鱼app

多媒体技术 1 多媒体观点“多媒体”一词译自英文“Multimedia”,而该词又是由 multiple 和 media 复合而成,焦点词是媒体。媒体(medium)在盘算机领域有两种寄义:一是指存储信息的实体,如磁盘、光盘、磁带、半导体存储器等,中文常译为媒质;二是指通报信息的载体,如数字、文字、声音、图形和图像等,中文译作前言,多媒体技术中的媒体是指后者。其实,“媒体”的观点规模是相当广泛的。

“媒体”有 下列五大类:(1)感受媒体(Perception medium)指的是能使人发生直接感受的媒体。如声音、动画、文本等;(2)表现媒体(Representation medium)指的是为了传送感受媒体而人为研究出来的媒体。诸如语言编码、电报码、条形码等等; (3)显示媒体(Presentation medium)指的是用于通信中使电信号和感受媒体之间发生转换用的媒体。

如键盘、鼠标器、打印机等;(4)存储媒体(Storage medium) 指的是于存放某种媒体的媒体。如纸张、磁带、磁盘、光盘等;(5)传输媒体 (Transmission medium)指的是用于传输某些媒体的媒体。常用的有如电话线、 电缆、光纤等。

多媒体技术就是融盘算机、声音、文本、图像、动画、视频和通信等多种功效于一体的技术,它借助日益普及的高速信息网,可实现盘算机的全球联网和信息资源共享,而且它给传统的盘算机系统、音频和视频设备带来了偏向性的厘革, 将对公共传媒发生深远的影响。因此多媒体将加速盘算机进人家庭和社会各个方面的历程,给人们的事情、生活和娱乐带来深刻的革命。

多媒体技术涉及的内容包罗: 多媒体数据压缩:多模态转换、压缩编码; 多媒体处置惩罚:音频信息处置惩罚,如音乐合成、语音识别、文字与语音相互转换; 图像处置惩罚,虚拟现实; 多媒体数据存储:多媒体数据库; 多媒体数据检索:基于内容的图像检索,视频检索; 多媒体著作工具:多媒体同步、超媒体和超文本; 多媒体通信与漫衍式多媒体:CSCW、集会系统、VOD 和系统设计; 多媒体专用设备技术:多媒体专用芯片技术,多媒体专用输入输出技术;  多媒体应用技术:CAI 与远程教学,GIS 与数字地球、多媒体远程监控等。2 多媒体技术生长历史  启蒙生长阶段多媒体技术的一些观点和方法,起源于 20 世纪 60 年月。

1965 年,纳尔逊 (Ted Nelson)为盘算机处置惩罚文本文件提出了一种把文本中遇到的相关文本组织在一起的方法,并为这种方法杜撰了一个词,称为“hypertext(超文本)”。与传统的方式差别,超文本以非线性方式组织文本,使盘算性能够响应人的思维以及能够利便地获取所需要的信息。

万维网(WWW)上的多媒体信息正是接纳了超文本思想与技术,组成了全球规模的超媒体空间。多媒体技术实现于 20 世纪 80 年月中期。

1984 年美国 Apple 公司在研制 Macintosh 盘算机时,为了增加图形处置惩罚功效,改善人机交互界面,缔造性地使用了位映射(bitmap)、窗口(window)、图符(icon)等技术。这一系列革新所带来的图形用户界面(GUI)深受用户的接待,加上引入鼠标作为交互设备, 配合 GUI 使用,大大利便了用户的操作。Apple 公司在 1987 年又引入了“超级卡”(Hypercard),使 Macintosh 机成为更容易使用、易学习而且能处置惩罚多媒体信息的机械,受到盘算机用户的一致赞誉。 尺度化阶段自 20 世纪 90 年月以来,多媒体技术逐渐成熟。

多媒体技术从以研究开发为重心转移到以应用为重心。由于多媒体技术是一种综合性技术,它的实用化涉及到盘算机、电子、通信、 影视等多个行业技术协作,其产物的应用目的,既涉及研究人员也面向普通消费 者,涉及各个用户条理,因此尺度化问题是多媒体技术实用化的关键。在尺度化多媒体技术阶段,研究部门和开发部门首先各自提出自己的方案,然后经分析、测试、比力、综合,总结出最优、最便于应用推广的尺度,指导多媒体产物的研制。

静态图像的一个尺度,是国际电信同盟(ITU)的T.81。静态图像的主要尺度称为JPEG尺度(ISO/IEC 10918)。它是 ISO 和 IEC 团结建立的专家组 JPEG (Joint Photographic Experts Group)建设的适用于单色和彩色、多灰度一连色调静态图像国际尺度。

该尺度在 1991 年通过,成为 ISO/IEC10918 尺度,全称为 “多灰度静态图像的数字压缩编码”。视频/运动图像的主要尺度是国际尺度化组织(ISO)下属的一个专家组 MPEG(Moving Picture Experts Group)制定的 MPEG-1(ISO/IEC11172)、MPEG- 2(ISO/IEC13818)和 MPEG-4(ISO/IEC 14496)三个尺度。

与MPEG-1、4等效的国际电信同盟(ITU)尺度,在运动图像方面有用于视频集会的H.261(Px64)、 用于可视电话的 H.263。在多媒体数字通信方面(包罗电视集会等)制定了一系列国际尺度(表 01-03-2),称为 H 系列尺度。

这个系列尺度分为两代。H.320、H.321 和 H.322 是第 一代尺度,都以 1990 年通过的 ISDN 网络上的 H.320 为基础。H.323、H.324 和 H.310 是第二代,使用新的 H.245 控制协议而且支持一系列革新的多媒体编、解码器。

更深条理的多媒体技术尺度也开始推出或列入开发中。一个典型的尺度是称作“多媒体内容形貌接口”的 MPEG-7 尺度(ISO/IEC15938)。

与已经推出的几个 MPEG 尺度差别,MPEG-7 是一个关于表现音/视信息的尺度。它的七个组成部件中,系统、形貌界说语言(DDL)、视频、音频和多媒体形貌方案等已经成为正式尺度,参考软件和一致性测试则计划在 2002 年 9 月成为尺度。

 蓬勃生长时期随着多媒体种种尺度的制定和应用,极大地推动了多媒体工业的生长。许多多媒体尺度和实现方法(如 JPEG、MPEG 等)已被做到芯片级,并作为成熟的商品投入市场。

与此同时,涉及到多媒体领域的种种软件系统及工具,也如雨后春笋,层出不穷。这些既解决了多媒体生长历程必须解决的难题,又对多媒体的普及和应用提供了可靠的技术保障,并促使多媒体成为一个工业而迅猛生长。代表之一是进一步生长多媒体芯片和处置惩罚器。1997 年 1 月美国 Intel 公司推出了具有 MMX 技术的飞跃处置惩罚器(Pentium processor with MMX),使它成为多媒体盘算机的一个尺度。

飞跃处置惩罚器在体系结构上有三个主要的特点:(1)增加了新的指令,使盘算机硬件自己就具有多媒体的处置惩罚功效(新添 57 个多媒体指令集),能更有效地处置惩罚视频、音频和图形数据。(2)单条指令多数据处置惩罚 (SIMD, Single Instruction Multiple Dataprocess)淘汰了视频、音频、图形和动画处置惩罚中常有的耗时的多循环。

(3)更大的片内高速缓存,淘汰了处置惩罚器不得不会见片外低速存储器的次数。飞跃处置惩罚器使多媒体的运行速度成倍增加,并已开始取代一些普通的功效卡板。随着网络电脑(Internet PC、NC)及新一代消费性电子产物,如电视机顶盒 (Set-Top Box)、DVD、视频电话(Video Phone)、视频集会(Video Conference) 等看法的崛起,强调应用于影像及通讯处置惩罚上最佳的数字信号处置惩罚器(DSP), 经由另一番的结构包装,可由软件驱动组态的方式,进入咨询及消费性的多媒体处置惩罚器市场。

现在多媒体技术及应用正在向更深条理生长。下一代用户界面,基于内容的多媒体信息检索,保证服务质量的多媒体全光通信网,基于高速互联网的新一代漫衍式多媒体信息系统等等,多媒体技术和它的应用正在迅速生长,新的技术、新的应用、新的系统不停涌现。3 人才概况  全球人才漫衍学者舆图用于形貌特定领域学者的漫衍情况,对于举行学者观察、分析各地域竞争力现况尤为重要,下图为多媒体领域全球学者漫衍情况。舆图凭据学者当前就职机构地理位置举行绘制,其中颜色越深表现学者越集中。

从该舆图可以看出,美国的人才数量优势显着且主要漫衍在其工具海岸;亚 洲东部也有较多的人才漫衍;欧洲的人才主要集中在欧洲中西部;其他诸如非洲、 南美洲等地域的学者很是稀少;多媒体领域的人才漫衍与各地域的科技、经济实力情况大要一致。多媒体全球学者漫衍此外,在性别比例方面,多媒体领域中男性学者占比 91.7%,女性学者占比 8.3%,男性学者占比远高于女性学者。多媒体领域学者的 h-index 漫衍如下图所示,大部门学者的 h-index 漫衍在 中低区域,其中 h-index 在 20-30 区间的人数最多,有 691 人,占比 34.2%,50- 56 区间的人数最少,有 124 人。

多媒体学者 h-index 漫衍 中国人才漫衍我国专家学者在多媒体领域的漫衍如下图所示。通过下图我们可以发现,京津地域在本事域的人才数量最多,其次是长三角和珠三角地域,相比之下,内陆地域的人才较为匮乏,这种漫衍与区位因素和经济水平情况不无关系。同时,通过视察中国周边国家的学者数量情况,特别是与日韩、东南亚等亚洲国家相比,中国在多媒体领域学者数量较多且有一定的优势。

多媒体中国学者漫衍 中国国际互助中国与其他国家在多媒体领域的互助情况可以凭据 AMiner 数据平台分析获得,通过统计论文中作者的单元信息,将作者映射到各个国家中,进而统计中国与各国之间互助论文的数量,并根据互助论文揭晓数量从高到低举行了排序,如下表所示。多媒体领域中国与各国互助论文情况从上表数据可以看出,中美互助的论文数、引用数、学者数遥遥领先,讲明中美间在多媒体领域互助之密切;同时,中国与欧洲的互助很是广泛,前 10 名互助关系里中欧互助共占 5 席;中国与德国互助的论文数虽然不是最多,可是拥有最高的平均引用数说明在互助质量上中德互助到达了较高的水平。4 多媒体技术希望近年来,随着数字化技术的生长,多媒体技术突飞猛进,音视频技术是当前最活跃、生长最迅速的高新技术领域之一。多媒体分析以文本、图像、声音、视 频等多种差别类型媒体的数据为研究工具,主要的研究目的一方面是使盘算机具备人类的多媒体(如视、听)明白能力,另一方面是从多媒体数据中挖掘信息和知识、资助人类更好地明白世界。

多媒体技术研究领域包罗多媒体信息处置惩罚、多媒体数据压缩编码、多媒体内容分析与检索技术、多媒体交互与集成、多媒体通信与网络、多媒体内容宁静、 多媒体系统与虚拟现实等。在近几年的研究中,多媒体技术出现出与盘算机体系结构、盘算机网络、人机交互、信息宁静、社会网络等多学科交织融合的生长趋势。

近两年多媒体领域研究热点主要集中在大规模图像视频分析、社会媒体研究、 多模态人机交互、盘算视觉、盘算图像、实时视频流化等方面。由于多媒体数据往往是多种信息的通报前言(例如一段视频中往往会同时使得文字信息、视觉信息和听觉信息获得流传),多模态学习已逐渐生长为多媒体内容分析与明白的主要手段。在盘算图像方面,大规模数据集的构建仍是一个热点研究偏向,尤其语义工具的像素级标注需求越来越强烈,能够人机交互标注的历程中不停学习的协同标注方法获得了广泛关注。

无监视学习是多媒体数据分析的久远目的。现在许多领域拥有大量的数据, 可是这些数据都是没有经由标志的。因此除了基本的数据勘探和异常检测场景,这些数据基本无法使用。近期在使用未标志的数据来革新(标志数据)监视学习历程方面已经取得了许多希望。

此外自念头器学习(AutoML)和元学习(Meta Learning)的最新研究结果 及其在多媒体上的应用也逐渐增多。在图像压缩处置惩罚方面,也有一些研究事情将深度学习用于图像或视频压缩后处置惩罚,并获得了一定的效果。

然而,现有事情的一个主要问题是用于后处置惩罚的深度网络较为庞大,盘算速度慢,不满足实际应用的需求。如何在处置惩罚效果和处置惩罚速度之间取得一个折中,是压缩后处置惩罚的一个主要挑战。图神经网络(Graph Neural Network, GNN)在多媒体领域的应用是近两年的热点研究偏向,应用场景包罗:个性化推荐,如基于多模态图卷积网络(MMGCN) 的多模态推荐方法;短视频推荐,如使用基于图的顺序网络举行建模;多视频摘要,如接纳图卷积网络权衡每个视频的重要性和相关性;基于文本的行人搜索, 如使用深度反抗图注意力卷积网络(A-GANet)使用文本和视觉场景图学习团结特征空间;视频关系监测,如使用转移图神经网络(DoT-GNN)解决图像外观变化的问题。随着 Mask-RCNN 与 RetinaNet 的生长,物体检测研究日趋成熟,但即便如此,就应用而言,当前的技术依然存在诸多缺陷,为此,针对现代目的检测的基本框架(backbone、head、scale、batchsize 与 post-processing),神经网络架构搜索(NAS)以及细粒度图像分析(FGIA)等 3 个方面的潜在难题成为主要研究内容,尤其是后两者,将成为未来视觉物体检测的两个重要研究维度。

扩展阅读:人工只能生长概况:机械学习篇人工智能生长概况:盘算机视觉篇人工智能生长概况:知识工程篇人工智能生长概况:自然语言处置惩罚篇人工智能生长概况:语音识别篇视频:人工智能时代资料泉源:公然网络。


本文关键词:人工智能,生长,概况,多媒体,技术篇,乐鱼app,多媒体

本文来源:乐鱼app-www.hjt-food.com