一、最新3D图形芯片(论文文献综述)
邢立冬[1](2017)在《GPU功耗评估和优化技术研究》文中研究表明论文来源于国家自然科学基金重点项目“新一代图形处理系统芯片体系结构及关键技术研究”。图形处理器(GPU)的应用已经从桌面计算系统、手持和便携电子设备、游戏机等领域扩展到高性能计算和人工智能等领域。GPU架构从原来的图形专用加速器发展到现在的单指令流多数据流或单指令流多线程处理器。现代的GPU不仅仅是一个特殊用途的加速器或几何引擎,它也可以作为一个通用计算芯片。在集成电路工艺进步和应用发展的驱动下,当前的图形处理系统芯片正在发生变革。因此,针对新型图形算法和通用计算的需求,面向未来图形处理器芯片高级应用的不断发展,在体系结构方面应对长线、功耗和工艺缺陷等问题,研究新一代图形系统芯片的体系结构和关键技术,具有重要的科学意义,研究和设计GPU芯片,打破国外的垄断是我国社会和经济发展的迫切需要。本文研究一种多态并行GPU的体系结构设计及功耗估计和功耗优化技术,主要从以下四个方面展开研究:1、提出了一种多态并行图形处理器的硬件体系结构。为了更好适应新的图形计算和通用计算的要求,应对未来芯片制造工艺的挑战,提出了一种多态并行GPU体系结构,其芯片实现为Firefly2。Firefly2的架构是由同构的处理器单元构成的二维阵列,处理器之间采用邻接互连技术。邻接互连技术减少了长线,降低了功耗,有利于信号完整性。处理器指令集是根据大量的图形处理仿真试验和统计分析结果优化设计的。指令系统的设计保证了指令的邻接寻址,邻接寻址指令构成的程序可以“重构”处理器阵列,使其像专用电路一样高效地完成操作级并行计算。也可以通过指令的广播使多个处理器执行同样的指令完成数据级并行计算。在指令存储器中存放的指组(由多条指令组成)能够完成多指令流的线程级并行计算。这样就实现了用指令流计算统一各种并行计算模式,具有程序设计的灵活性和计算的高效性。另外,我们在Firefly2处理器上分别实现了3D图形渲染流水线和计算机视觉应用,并进行了仿真实验。实验研究表明,Firefly2架构具有良好的高性能执行图形渲染和图像处理程序的潜力。2、正确有效的功耗建模与评估技术是有效进行低功耗设计的基础,没有准确的估计功耗的手段,就难以设计出符合功耗预算的芯片。本文提出了一种新的3D图形渲染管线的能耗估计模型,包括3D图形渲染管线计算阶段的能耗估计模型、数据存储器访问的能耗估计模型和指令存储器访问的能耗估计模型。通过对3D图形渲染管线中影响渲染质量的两个关键模块顶点着色器和像素着色器的负载进行分析,得出了像素数与顶点数的比值模型。同时采用正向分析和根据经典图形渲染算法相结合的方法对3D图形渲染管线各阶段的能耗进行了建模,包括几何变换阶段、顶点着色阶段、视景体裁剪阶段、背面剔除阶段、扫描转换阶段、像素着色阶段及段操作阶段。并对顶点着色阶段和像素着色阶段的能耗估计模型进行了验证,结果表明模型达到了较高的预测精度。与以往研究不同之处在于建模过程不做任何底层硬件架构的假设,使得该模型具有广泛的适用性。3、超大规模集成电路技术已经发展到可以将数百亿个晶体管集成到一个芯片上。集成度的提升给GPU带来了巨大计算能力的提升,但也带来了巨大的能量消耗。功耗已经成为当今GPU设计中最关键的限制因素,而有效的功耗结构设计已经成为决定GPU芯片性能的重要因素之一。本文从分析功耗的来源入手,对集成电路中的功耗组成进行了分析,研究了从系统级、体系结构级、寄存器传输级、逻辑级、电路级、工艺级等各个层次上降低功耗的方法。分别从软件层面和硬件层面提出了一些降低功耗的措施,并进行了实验验证。其中,在软件层面,通过理论分析和仿真提出了几种适用于3D图形渲染的低功耗编程技术,包括顶点共享、时钟关断技术(HALT命令)、LOD技术和静态目标缓存技术(BEGINOBJ和ENDOBJ命令)。实验验证结果表明,这些低功耗编程技术可以显着降低3D图形应用的功耗和能耗。硬件层面采取的功耗优化措施主要包括多阈值技术、门控时钟技术、门控电源技术和多电压技术。功耗分析结果表明,采用上述硬件层面的功耗优化技术使功耗下降了65.23%。4、提出了一种面向能耗感知的处理单元(PE)调度器的设计方法。首先,利用阿姆达尔定律对Firefly2处理器进行功耗的建模和能耗的建模;然后,提出了一种兼顾能效的最小化能耗调度算法;最后,基于所建立的功耗模型、能耗模型和调度算法,并利用系统内所设计的性能计数器,完成了PE调度器的设计。所设计的PE调度器的调度策略是根据应用选择运行的PE以及PE工作的频率。
焦继业,李涛,杜慧敏,韩俊刚[2](2015)在《移动图形处理器的现状、技术及其发展》文中进行了进一步梳理3D图形绘制技术已经渗透到各种移动设备中.相对于桌面PC,移动设备图形处理需要以更低的功耗、更有限的内存带宽和较低的运算能力实现高性能、高质量的图形显示效果.文中介绍了移动图形处理器发展现状,从硬件设计方面分析了这一领域未来面临的挑战;分析了当前移动图形处理器中区块式和立即式渲染的架构特点,总结了渲染过程中加速数据流计算方法和芯片低功耗设计方法.最后展望了移动图形处理器的发展趋势.
史鸿声[3](2008)在《可信嵌入式3D图形系统关键技术的研究》文中认为在后PC时代,对于嵌入式3D图形加速系统的应用需求日益增长。在嵌入式设备中进行3D图形加速设计的时候,必须考虑到诸如芯片面积、执行性能、功耗、成本等方面的限制。不仅如此,随着网络时代的到来,还需要解决嵌入式设备数据在网络环境中传输的安全性问题。这就对嵌入式应用系统提出了以下需求:稳定可靠的高性能嵌入式硬件平台,合适的嵌入式操作系统,适用于嵌入式环境需求的3D图形加速设备。针对以上这些嵌入式3D图形加速系统的应用需求,本文提出了一种基于RISC微处理器的具有安全功能的可信嵌入式3D图形加速系统的软硬件实现方案,对其中的一些关键技术如嵌入式技术、图形加速技术、安全技术等进行了分析研究。提出了以下设计方案:1)在系统平台方面,采用了具有高可靠性的LEON3硬件平台和嵌入式Linux操作系统,首先确保了整个嵌入式系统的稳定可靠;2)在平台上加入了自主设计的3D图形加速模块,提高了嵌入式环境下3D图形加速的性能;3)为上述平台的在网络中的应用设计了一套较完善的安全认证方案,确保了数据的安全性。以上这几点构成一个可信的嵌入式3D图形加速系统,具有较好的实用价值。本文的主要贡献及创新之处:(1)提出了一种可信嵌入式3D图形加速系统的整体架构和安全模型。系统采用高可靠性的LEON3微处理器平台,嵌入式Linux操作系统,使用自主设计的3D图形加速模块,并结合加密认证算法,实现了图形数据的安全传输和实时处理:(2)对32位LEON3 RISC微处理器的体系结构、指令系统、容错机制、可配置性等技术特点进行了深入分析与研究,并根据实际需求进行了详细的定制工作,实现了一个高性能和高可靠性的可信嵌入式系统硬件平台。(3)对嵌入式Linux操作系统的体系结构、内核子系统、文件结构和启动流程,以及其内核生成过程进行了详细的分析研究,并在本文设计的LEON3硬件平台上,完成了移植工作。文中对系统定制的详细内容和NFS网络文件系统的实现过程进行了描述;(4)根据软硬件划分的原则,提出了嵌入式系统下的真实感3D图形加速设计方案。方案采用嵌入式微处理器软件进行图形加速几何阶段的计算,对图形加速的光栅阶段采用硬件IP核来实现。整个算法采用了定点化的实现方式,在几何阶段,对三维裁剪算法进行了优化设计,采用了在三维透视视见体的六个裁剪面分别进行二维裁剪和插值的方法,减少了计算量,降低了CPU的运算负担。在光栅阶段,采用了基于tile的处理方式,减少了扫描转换和纹理映射的运算量,但仍保持了较好的图像质量。纹理映射部分采用了纹理压缩和两级Cache的设计方式,采用S3TC的压缩算法,可以达到6:1的压缩比率,减少了对总线带宽的需求。采用了Mipmap+双线性滤波的纹理映射算法,提高了纹理映射的速度,并且具有较好的渲染质量。(5)对网络环境下嵌入式3D图形数据传输上的安全问题进行了探讨,提出了只对关键参数加密的优化设计方法,并给出了AES+SHA-1加密认证和RSA密钥管理相结合的安全模型。从而在确保可信嵌入式3D图形加速系统的安全性的前提下,减少了运算量,降低了系统资源的消耗,满足了实际应用的需求。目前国内对于图形学的研究更多关注于多媒体技术、建筑设计软件等领域,对3D图形加速技术的研究还很有限。设计具有较高性能的嵌入式3D图形加速系统,对提高我国嵌入式产业的发展水平,增强在国际上的竞争力,以及国防建设的发展等都具有重大的意义。
Walkmanfz,Zero[4](2004)在《独立为先整合有道 整合芯片组评测专题》文中研究说明 显示技术仍是目前PC个人电脑多媒体领域中最为活跃的一种。展望目前电脑的各种配件,CPU市场由Intel掌控大局,用户面对日益增长的频率数字似乎再也感觉不到当年频率提升所带来的性能的飞跃;音频市场除了大部分消费者选择的板载声卡,独孤求败的创新占据了其它大部分的市场份额;内存,硬盘更是如此,除了容量的慢慢提升,现在也没有令人振奋的新技术被采用。而反观显示技术,自从Voodoo显卡将电脑的视觉世界从2D时代带入3D时代以来,其发展的速度似乎就一直没有减慢,这多少也是拜ATi与nVIDIA两家实力相当的竞争对手所赐。
胡纲[5](2004)在《直击图像产业》文中指出在计算机王国中,David Kirk所从事的职业无疑是最让人羡慕的一种,他在全球知名的图形芯片开发公司nVidia工作,担任该公司的首席研究员。43岁的Kirk是一个整天与复杂的运算规则打交道的计算机专家,他的脑中只有一个念头:构建适用于计算机游戏、商业模拟和医学成像等领域的新一代图形引擎。“实现纯3D的虚拟现实”是他的终极目标。
张宁[6](2003)在《杀手代号:NV30》文中提出 2002年对于图形芯片领域来说有着重大的意义,各大芯片厂商纷纷推出全新架构的图形芯片。从年初NVIDIA推出的GeForcc 4系列,Matrox推出全新架构的Parhelia-512芯片,到3DLabs的P10芯片,还有ATI旗舰级的RADEON
吕华威,王丁,王泉[7](2002)在《3D原动力》文中提出在先进的3D图形技术的帮助下,好莱坞大片中的电脑特技让人们如醉如痴,而电脑游戏和医疗也从中获益匪浅。大约6年前,源自学术机构和军方的3D图形技术如暴风骤雨般席卷了几乎所有的消费PC,犹如发生了一场革命。如今,最新的3D图形卡性能怎样?你会看到我们全面的测试报告。如果你对3D图形技术有兴趣,我们还会带你走入图形芯片的内部,看看那些漂亮的画面是如何绘制出来的。
施化宇,黄宇,方文[8](2000)在《缤纷色彩妖娆——14款显示卡横向评测》文中研究表明3D世界的缤纷,由显示芯片所创造,每个新兴的显示芯片,都为我们带来了或多或少的兴奋
雅君,毛睿[9](1999)在《99PC新面孔——国产商用PC产品,技术选购指南》文中研究说明 在1999年,CPU的发展呈现出一种加速前进的景象:主频更高、速度更快。 首先,龙头大哥Intel在2月率先推出了450MHz和500MHz的Pentium Ⅲ,到下半年将达到700MHz的速度。这种CPU采用了100MHz总线频率,带有“16KB指令缓存+16KB数据缓存”共32KB的L1一级缓存和512KB的二级缓存。与Pentium Ⅱ相比,除了主频更高以外,主要的一个区别就是Pentium Ⅲ内置了70条MMX2指令,Intel称之为SSE(Streaming SIMD Extensions,数据流单指令多数据扩展)指令集。该指令集主要增强了CPU的双精度浮点运算能力,对3D图形处理如三维成像、数字图像、视频编辑等具有优化和加速的作用,并可以大大提高PC在Internet应用、声音处理、语
鲍华,王向阳,薛海滨[10](1999)在《3D显卡”烧“起来——1999年主流3D显卡产品、技术选购指南》文中研究说明 综合篇 在1998年第三季度,各种基于第三代3D图形芯片,如nVidia的Riva TNT、3Dfx的VooDooⅡ和Banshee、Intel的i740、S3的Savage、Matrox的G200和SiS的6326等的显卡产品纷纷上市。但由于这些3D芯片在上市之初出现了一些问题,如Intel的i740发生了与非Intel芯片组不兼容的情况,S3的Savage由于驱动程序的不完善而在运行3D游戏和应用软件时出现了许多Bug,nVidia的RivaTNT也由于采用了0.35微米工艺(而不
二、最新3D图形芯片(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、最新3D图形芯片(论文提纲范文)
(1)GPU功耗评估和优化技术研究(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景 |
1.1.1 GPU发展概况 |
1.1.2 并行计算 |
1.1.3 GPU发展面临的问题 |
1.2 相关研究工作 |
1.2.1 GPU体系结构发展 |
1.2.2 GPU负载特性和性能研究 |
1.2.3 GPU功耗建模与估计方面的研究 |
1.2.4 功耗优化技术研究 |
1.3 本文的工作和主要创新点 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.3.3 创新点 |
1.4 论文结构 |
第二章 Firefly2硬件体系结构设计 |
2.1 Firefly2编程模型 |
2.2 Firefly2架构设计 |
2.2.1 指令集结构 |
2.2.2 Firefly2系统结构 |
2.2.3 簇结构 |
2.2.4 簇控制器 |
2.2.5 行控制器 |
2.2.6 列控制器 |
2.2.7 处理器单元 |
2.2.8 数据传输 |
2.2.9 通信机制 |
2.3 Firefly2上的并行计算 |
2.3.1 数据级并行计算 |
2.3.2 线程级并行计算 |
2.3.3 操作级并行计算 |
2.3.4 分布式指令级并行计算 |
2.3.5 混合并行处理方式 |
2.4 在Firefly2上实现3D图形渲染 |
2.4.1 固定图形渲染管线的实现 |
2.4.2 统一渲染管线的实现 |
2.5 在Firefly2上实现计算机视觉 |
2.6 软件仿真环境 |
2.7 与相关工作的比较 |
2.8 本章小结 |
第三章 3D图形渲染管线的能耗建模及性能分析 |
3.1 3D图形渲染管线 |
3.1.1 渲染管线 |
3.1.2 图元 |
3.2 能耗建模 |
3.2.1 几何变换 |
3.2.2 顶点着色 |
3.2.3 视景体裁剪 |
3.2.4 背面剔除 |
3.2.5 扫描转换 |
3.2.6 像素着色 |
3.2.7 段操作 |
3.3 性能分析 |
3.3.1 着色器负载分析 |
3.3.2 存储器带宽分析 |
3.3.3 能耗估计模型 |
3.4 模型验证 |
3.4.1 实验平台和测试用例 |
3.4.2 结果与分析 |
3.5 本章小结 |
第四章 Firefly2处理器功耗优化 |
4.1 功耗组成与分析 |
4.1.1 动态功耗 |
4.1.2 静态功耗 |
4.1.3 功耗分析 |
4.2 低功耗设计技术 |
4.2.1 工艺级 |
4.2.2 电路级 |
4.2.3 逻辑级 |
4.2.4 RTL级 |
4.2.5 体系结构级 |
4.2.6 系统级 |
4.3 软件功耗优化技术 |
4.3.1 采用索引三角形列表 |
4.3.2 顶点共享 |
4.3.3 时钟关断 |
4.3.4 静态目标缓存 |
4.3.5 LOD技术 |
4.3.6 实验与分析 |
4.4 硬件功耗优化技术 |
4.4.1 插入门控时钟 |
4.4.2 多阈值技术的实现 |
4.4.3 基于UPF实现多电压域及门控电源 |
4.4.4 实验与分析 |
4.5 本章小结 |
第五章 面向能耗感知的PE调度器设计 |
5.1 阿姆达尔定律 |
5.2 利用Amdahl定律对Firefly2处理器进行功耗建模 |
5.3 调度算法 |
5.4 PE调度器的设计 |
5.4.1 基于性能计数器获得PE能耗 |
5.4.2 调度器的设计 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 论文工作总结 |
6.2 工作展望 |
参考文献 |
致谢 |
作者简介 |
(3)可信嵌入式3D图形系统关键技术的研究(论文提纲范文)
摘要 |
Abstract |
目录 |
插图目录 |
表格目录 |
第一章 绪论 |
1.1 研究背景 |
1.1.1 嵌入式系统 |
1.1.2 嵌入式图形加速技术 |
1.1.3 安全技术 |
1.2 可信嵌入式3D图形系统的研究现状 |
1.2.1 嵌入式处理器和图形加速的研究现状 |
1.2.2 嵌入式操作系统 |
1.2.3 嵌入式设备上的安全机制 |
1.3 本文研究的主要内容和结构安排 |
1.4 本章小结 |
第二章 可信嵌入式3D图形系统的架构 |
2.1 可信嵌入式图形系统的整体架构 |
2.2 可信嵌入式图形系统的安全模型 |
2.2.1 可靠的LEON3平台 |
2.2.2 加密认证机制 |
2.3 嵌入式系统 |
2.3.1 嵌入式系统的硬件部分 |
2.3.2 嵌入式系统的软件部分 |
2.4 3D图形加速模块 |
2.4.1 3D图形加速的工作流程 |
2.4.2 嵌入式3D图形加速的特点 |
2.4.3 嵌入式环境下的3D图形加速设计 |
2.5 本章小结 |
第三章 基于LEON3的嵌入式平台设计 |
3.1 LEON3处理器介绍 |
3.1.1 LEON3的物理结构 |
3.1.2 LEON3的主要模块 |
3.2 LEON3的技术特点 |
3.2.1 SPARC V8体系结构 |
3.2.2 LEON3的SMP支持 |
3.2.3 LEON3的高度可配置性 |
3.2.4 LEON3的可靠性设计—容错设计 |
3.3 LEON3的总线机制 |
3.3.1 系统总线控制器 |
3.3.2 外围总线 |
3.4 实验平台设计 |
3.5 实验结果 |
3.6 本章小结 |
第四章 可信嵌入式平台Linux操作系统的实现 |
4.1 Linux体系结构分析 |
4.1.1 Linux系统结构 |
4.1.2 内核子系统 |
4.1.3 用户界面Shell |
4.1.4 Linux的文件系统 |
4.1.5 Linux系统的启动过程 |
4.1.6 Linux的源代码文件 |
4.2 Linux操作系统在LEON3嵌入式平台上的移植 |
4.2.1 Linux内核的移植 |
4.2.2 NFS网络根文件系统的实现 |
4.2.3 Linux帧缓冲的读写操作 |
4.3 本章小结 |
第五章 可信嵌入式3D图形系统图形功能的实现 |
5.1 3D图形加速的软硬件划分 |
5.2 3D图形加速平台的总体设计方案 |
5.3 几何阶段的算法设计 |
5.3.1 模型与视点变换 |
5.3.2 简单光照 |
5.3.3 投影变换 |
5.3.4 三维裁剪 |
5.3.5 屏幕映射 |
5.3.6 定点化的设计 |
5.4 光栅阶段的算法设计 |
5.4.1 扫描转换部分 |
5.4.2 纹理映射算法 |
5.4.3 可见性测试 |
5.5 性能测试与分析 |
5.5.1 在桌面PC上的3D图形加速软件模拟结果 |
5.5.2 在LEON3嵌入式系统平台上的3D图形加速实验结果 |
5.5.3 硬件性能评估 |
5.6 本章小结 |
第六章 可信嵌入式图形系统安全机制的实现 |
6.1 嵌入式可信图形系统的安全模型 |
6.1.1 参数化的加密方式 |
6.1.2 安全机制的总体框架 |
6.2 可信图形处理系统的算法描述 |
6.2.1 AES算法 |
6.2.2 AES算法的性能测试与安全性分析 |
6.2.3 RSA算法 |
6.2.4 SHA-1消息认证算法 |
6.2.5 SHA—1算法实现的性能测试与分析 |
6.3 本章小结 |
第七章 总结与展望 |
7.1 全文的总结 |
7.2 进一步的研究工作 |
参考文献 |
发表的学术论文与科研情况 |
致谢 |
(5)直击图像产业(论文提纲范文)
着色器程序:必备的电影仿真技术 |
DirectX:游戏开发商和美工都是它的用户群 |
Longhorn:适合于办公室的3D图形 |
硬件候选人:ATI和nVidia |
PCI Express:打破带宽瓶颈 |
Just-In-Time编译技术:优化性能 |
四、最新3D图形芯片(论文参考文献)
- [1]GPU功耗评估和优化技术研究[D]. 邢立冬. 西安电子科技大学, 2017(01)
- [2]移动图形处理器的现状、技术及其发展[J]. 焦继业,李涛,杜慧敏,韩俊刚. 计算机辅助设计与图形学学报, 2015(06)
- [3]可信嵌入式3D图形系统关键技术的研究[D]. 史鸿声. 中国科学技术大学, 2008(06)
- [4]独立为先整合有道 整合芯片组评测专题[J]. Walkmanfz,Zero. 电脑自做, 2004(05)
- [5]直击图像产业[J]. 胡纲. 个人电脑, 2004(04)
- [6]杀手代号:NV30[J]. 张宁. 大众硬件, 2003(01)
- [7]3D原动力[J]. 吕华威,王丁,王泉. 个人电脑, 2002(04)
- [8]缤纷色彩妖娆——14款显示卡横向评测[J]. 施化宇,黄宇,方文. 微电脑世界, 2000(48)
- [9]99PC新面孔——国产商用PC产品,技术选购指南[J]. 雅君,毛睿. 中国计算机用户, 1999(15)
- [10]3D显卡”烧“起来——1999年主流3D显卡产品、技术选购指南[J]. 鲍华,王向阳,薛海滨. 中国计算机用户, 1999(13)