MMX� Technology General Support Intrinsics__m_packsswb-程序员宅基地

技术标签: Asm  integer  

转自 http://www.gursey.gov.tr/Gilgamesh-WWW/IntelCompDocs/c_ug/linux337.htm

The prototypes for MMX technology intrinsics are in the mmintrin.h header file.

Intrinsic
Name
Alternate
Name
Corresponding
Instruction
Operation Signed Saturation
_m_empty _mm_empty EMMS Empty MM state -- --
_m_from_int _mm_cvtsi32_si64 MOVD Convert from int -- --
_m_to_int _mm_cvtsi64_si32 MOVD Convert from int -- --
_m_packsswb _mm_packs_pi16 PACKSSWB Pack Yes Yes
_m_packssdw _mm_packs_pi32 PACKSSDW Pack Yes Yes
_m_packuswb _mm_packs_pu16 PACKUSWB Pack No Yes
_m_punpckhbw _mm_unpackhi_pi8 PUNPCKHBW Interleave -- --
_m_punpckhwd _mm_unpackhi_pi16 PUNPCKHWD Interleave -- --
_m_punpckhdq _mm_unpackhi_pi32 PUNPCKHDQ Interleave -- --
_m_punpcklbw _mm_unpacklo_pi8 PUNPCKLBW Interleave -- --
_m_punpcklwd _mm_unpacklo_pi16 PUNPCKLWD Interleave -- --
_m_punpckldq _mm_unpacklo_pi32 PUNPCKLDQ Interleave -- --
  
void  _m_empty(void)

Empty the multimedia state.
See The EMMS Instruction: Why You Need It figure for details.

__m64 _m_from_int(int i)

Convert the integer object i to a 64-bit __m64 object. The integer value is zero-extended to 64 bits.

int   _m_to_int(__m64 m)

Convert the lower 32 bits of the __m64 object m to an integer.

__m64 _m_packsswb(__m64 m1, __m64 m2)

Pack the four 16-bit values from m1 into the lower four 8-bit values of the result with signed saturation, and pack the four 16-bit values from m2 into the upper four 8-bit values of the result with signed saturation.

__m64 _m_packssdw(__m64 m1, __m64 m2)

Pack the two 32-bit values from m1 into the lower two 16-bit values of the result with signed saturation, and pack the two 32-bit values from m2 into the upper two 16-bit values of the result with signed saturation.

__m64 _m_packuswb(__m64 m1, __m64 m2)

Pack the four 16-bit values from m1 into the lower four 8-bit values of the result with unsigned saturation, and pack the four 16-bit values from m2 into the upper four 8-bit values of the result with unsigned saturation.

__m64 _m_punpckhbw(__m64 m1, __m64 m2)

Interleave the four 8-bit values from the high half of m1 with the four values from the high half of m2. The interleaving begins with the data from m1.

__m64 _m_punpckhwd(__m64 m1, __m64 m2)

Interleave the two 16-bit values from the high half of m1 with the two values from the high half of m2. The interleaving begins with the data from m1.

__m64 _m_punpckhdq(__m64 m1, __m64 m2)

Interleave the 32-bit value from the high half of m1 with the 32-bit value from the high half of m2. The interleaving begins with the data from m1.

__m64 _m_punpcklbw(__m64 m1, __m64 m2)

Interleave the four 8-bit values from the low half of m1 with the four values from the low half of m2. The interleaving begins with the data from m1.

__m64 _m_punpcklwd(__m64 m1, __m64 m2)

Interleave the two 16-bit values from the low half of m1 with the two values from the low half of m2. The interleaving begins with the data from m1.

__m64 _m_punpckldq(__m64 m1, __m64 m2)

Interleave the 32-bit value from the low half of m1 with the 32-bit value from the low half of m2. The interleaving begins with the data from m1.


版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/arau_sh/article/details/7577530

智能推荐

Bluetooth MESH探究 --- (7) BLE core spec之为什么BLE能有更低功耗_ble 为什么功耗低-程序员宅基地

文章浏览阅读3.6k次。BLE与其它蓝牙协议最典型的区别就是BLE是专门为低功耗、低复杂度以及低成本设备设计。那么,BLE是通过什么方法做到更多功耗的呢? 对于蓝牙设备甚至可以说对于所有无线通信设备来说,最大的功耗就来自于射频电路部分。比如,对于TI CC2540芯片来说,RF处于接收状态的电流为19.6mA,RF处于发射状态的电流为24mA,而RF处于sleep状态的电流仅为0.9uA。所以,如果能够最大限度地_ble 为什么功耗低

dg broker配置的问题及分析 (r7笔记第22天)-程序员宅基地

文章浏览阅读371次。今天在配置一个备库的时候碰到了一些问题,话说配置dg broker真没什么特别需要注意的细节了,本身已经给DBA省了很大的事儿了。但是有时候就是会出现一些稀奇古怪的小问题..._select dest_id,error from v$archive_dest where error is not null; dest_id er

cloudstack:iso 转换qcow2文件_iso转qcow2文件工具-程序员宅基地

文章浏览阅读5.2k次。背景介绍:我们在使用cloudstack 或者 openstack,注册kvm主机所需模板时,支持的其中一种格式是 qcow2,所以我们经常的做法是从网上去找这样的模板下载,问题来了1、模板太大,下载速度慢,浪费时间2、资源比较缺,种类也不够齐全。于是这就需要我们自己制作模板啦一、创建qemu-img create -f qcow2 CentOS-6.8-x86_64-mi_iso转qcow2文件工具

kereas里的各种层意义-程序员宅基地

文章浏览阅读1.5k次。1、其中在融合residual跟separable特征图的时候需要融合,其使用到的方法就是kereas里的layers里的add跟Add方法,其文档地址为:http://keras-cn.readthedocs.io/en/latest/layers/merge/Addkeras.layers.Add()添加输入列表的图层。该层接收一个相同shape列表张量,并返回它们的和,shape不变。Ex..._kereas

cf两边黑屏怎么解决win10_Win10屏幕两边有黑框怎么全屏-程序员宅基地

文章浏览阅读1.6k次。Win10全屏的时候会有黑框,尤其在看电影,玩游戏的时候,最为影响用户体验。大家可以尝试卸载重新安装显卡驱动或更新显卡驱动,看问题能不能解决。如果问题还得不到解决,那就用给大家带来的这篇文章教程进行操作吧,希望能帮助到大家。方法/步骤:1、按 Win + R 组合键,打开运行,并输入:regedit 命令,确定或回车,打开注册表编辑器2、注册表编辑器窗口中,依次展开 HKEY_LOCAL_MACH..._win10屏幕两边有黑框怎么全屏

ORA-00600: internal error code, arguments: [keltnf_ora-00600: internal error code, arguments: [kghfre-程序员宅基地

文章浏览阅读932次。ORA-00600: internal error code, arguments: [keltnfFri Nov 26 10:16:49 2010Errors in file /db/oracle10g/admin/test/udump/test_ora_29374.trc:ORA-00600: internal error code, arguments: [keltnfy-l_ora-00600: internal error code, arguments: [kghfrempty:ds], [0x7f4b4bced790]

随便推点

php+mysql操作_php-mysql-程序员宅基地

文章浏览阅读394次。、 这三种标签是可以不写的,直接写 _php-mysql

U盘用USB-zip方式启动_usb zip启动模式-程序员宅基地

文章浏览阅读2k次。说 明  本启动盘将微型WinPE(by老毛桃)、Win故障恢复控制台、矮人dos工具箱、DM9.75、PQ分区魔术师DOS版、KV2006 DOS杀毒伴侣、效率源硬盘修复、GDISK单硬盘快速分区、系统测试等集成到U盘中。U盘用USB-zip方式启动,启动后的菜单如下(图片不完全准确):微型WinPE内置的工具列表。 1.ERDCMD2003汉化版(开锁工、注册表编辑器、计算机管理、系统还原); 2.诺顿克_usb zip启动模式

python差分进化算法_差分进化算法(differential evolution)的Python实现-程序员宅基地

文章浏览阅读2.2k次。演化算法被归类为一组用于生物进化全局优化的算法,并且基于元启发式搜索方法。可能的解决方案通常跨越问题域上的n维向量空间,并且我们模拟几个总体粒子以达到全局最优。基本形式中的优化问题包括通过根据为算法提供的程序指令从可能的解元素(矢量)池中选择值来解决最大化或最小化实际函数的任务。进化方法通常遵循具有不同变化的特定策略,以从种群集合中选择候选元素,并应用交叉和/或突变来修改元素,同时尝试提高修饰元素..._differential evolution旅行商问题python

视频号、抖音、海外Tiktok到底该选择那个平台更好-程序员宅基地

文章浏览阅读821次。这个问题困扰了很多伙伴,因为现在平台居多,不知道该选择哪个,包括有很多朋友也向我反应我。那么我今天就腾出来自己宝贵的时间来详细剖析这三个平台。第一个,我就说说咱国内的抖音:抖音真正的红利其实是2018年、2019年和2020年。2018年那会小黄车还没上线,但是已经可以引流了,2019年是抖音红利最多的一年,这一年很多简单傻瓜化批量矩阵操作基本都是在这一年,有书单、手绘卖书、养生茶、视频带货、还有批量影视及电视剧和内容干货或者鸡汤结合起来的搬运玩法,2020年,18年和19年的搬运和简单类目的玩法就不

js中的typeof和instanceof的用法和区别(附类型判断方法)_js类型判断instence of mdn-程序员宅基地

文章浏览阅读7.2k次,点赞9次,收藏22次。typeof作用:用于判断一个一个表达式,(对象或者原始值),返回一个字符串。返回的可能的值(摘自mdn)类型结果Undefined"undefined"Null"object" (历史遗留问题)Boolean"boolean"Number"number"String"s_js类型判断instence of mdn

深度学习与神经网络的异同_神经网络和深度神经网络的区别-程序员宅基地

文章浏览阅读1w次,点赞6次,收藏25次。相同点:二者均采用分层结构,系统包括输入层,隐藏层(多层),输出层组成的多层网络,只有相邻层节点之间有连接,同一层以及跨层节点之间相互无连接,每一层都可以看作是一个logistic回归模型。不同点:(1)神经网络:特征映射到值,特征是人工挑选的。输入层->多层隐藏层->输出层 其输出层的维度与输入层一样(a)采用BP算法调整参数,即采用迭代式算法来训练整个网络。随机设..._神经网络和深度神经网络的区别