
计算机系统结构
文章平均质量分 88
轻闲一号机
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【计算机系统结构实验】实验5 多核编程(OpenMP编程)
但是,96个线程的程序运行的real时间比完全串行执行的real时间少了约87%,user用户CPU时间不相上下,sys系统CPU时间比完全串行执行的时间多了线程切换时间。从线程数为1到线程数为8,程序运行的real时间大幅减少,而从线程数为8往后,线程数的增加不会对程序运行的real时间产生较大影响;可以看到,96个线程的程序运行时间并不比完全串行执行的时间少,原因可能是clock()测量所有线程的累积时间,上下文切换影响到了多线程的执行速度。查看记录一下运行时间(这是完全串行执行的时间)。原创 2023-12-22 21:49:18 · 1421 阅读 · 0 评论 -
【计算机系统结构实验】实验4 向量扩展指令和编程
同时也了解了鲲鹏数学库的功能与使用,并编译运行了包含sin函数、vdsin函数、tan函数、vdtan函数的程序,对比了数组长度与不同函数对程序运行时间的影响。2. 使用_mm_load_ps函数从Input1和Input2数组(内存)中加载4个float型的元素,组合成1个__m128类型的向量数据,放入__m128类型(SSE指令采用的向量数据类型,是128位(16字节)的)的变量a和b(暂存器)中。2) 使用VIM编辑器,创建程序simd.c,使用sin函数作为耗时功能函数,并使。原创 2023-12-22 21:41:54 · 1527 阅读 · 0 评论 -
【计算机系统结构实验】实验3 Cache性能分析
2)按默认设置,即:统一Cache(容量64KB),块大小32B,相联度为1(即直接映像),替换策略LRU,不预取,写回法,写不命中时按写分配。因为统一Cache(容量64KB),块大小32B,相联度为1(即直接映像),所以有2048块(组),索引占11位。因为统一Cache(容量64KB),块大小32B,相联度为1(即直接映像),所以有2048块(组),索引占11位。因为统一Cache(容量64KB),块大小32B,相联度为1(即直接映像),所以有2048块(组),索引占11位。原创 2023-12-22 21:31:55 · 1804 阅读 · 0 评论 -
【计算机系统结构实验】实验2 流水线中的冲突实验
可以看到,RAW停顿在第0-24周期之间一共发生了12次。可以看到,定向功能减少了9次数据停顿,一共发生了三次RAW停顿,其中有两次为load停顿。用指令调度技术解决流水线中的数据冲突:全部复位,在MIPSsim中载入schedule.s样例程序。程序执行的总时钟周期数为20。指令调度可以通过在编译时让编译器重新组织指令顺序来消除冲突。原创 2023-12-22 21:16:39 · 4162 阅读 · 0 评论 -
【计算机系统结构实验】实验1 RISC体系结构与指令系统
了解和熟悉指令级模拟器MIPSsim的操作和使用方法;熟悉MIPS体系结构;熟悉MIPS指令系统及其特点,加深对MIPS指令操作语义的理解。原创 2023-12-22 21:02:37 · 1786 阅读 · 0 评论